百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python可视化Seaborn库详解——绘图方法

liuian 2024-12-15 15:25 31 浏览

在《Python可视化Seaborn库详解——绘图设置 》一文中,我们介绍了Seaborn库的绘图参数设置,本文我们将介绍具体的绘图方法。

其实虽然Seaborn库看着绘图函数多,但有几个函数的泛化性非常强,通过参数的设置是可以绘出多种图形的。为了便于掌握这些函数,本文会对这些方法进行归纳整理,力争做到提纲挈领的目的。


绘图方法分类


结合图形的性质,将常规的可视化图形分为了三类。

其中,线性关系所涉及到的是折线图和散点图,这两类图形在日常运用中非常常见;分类关系主要是描述不同维度下数据的统计结果,如条形图、箱图等;组合关系就类似于高级程序语言,它是由不同的基础图形组合而来的。

下面我们将一一介绍这些绘图方法。


线性关系可视化


我们用泰坦尼克号数据作为案例,首先进行数据准备。

import seaborn as sns
import pandas as pd
import numpy as np
data_raw=pd.read_csv("数据源/Titanic/train.csv")
df=data_raw.copy()
df.columns=[x.lower() for x in df.columns]
  • relplot
    relplot函数和待会要介绍的catplot函数一样,均是属于一般型方法,它通过kind参数可分别作折线图和散点图,而且也可通过col和row参数进行分面。另外,该函数要求的数据格式必须是DataFrame。下图为该函数的绘图。
sns.relplot(x="passengerid",y="age",col="pclass",hue=None,
            row=None,kind='scatter',data=df)
#kind为line,scatter;col表示按照该列进行分列绘图

#下面是具体的折线图和散点图函数,但这两种方法均不能进行分面
sns.lineplot(x="passengerid",y="age",data=df)
sns.scatterplot(x="passengerid",y="age",data=df)


分类关系可视化


分类关系有两个一般性绘图方法:catplot和distplot。

  • catplot

该函数可以绘制八种分类图,并可以进行分面。每种分类图也有相应的函数,可以进行更细致的参数设置,但均不能进行分面。

sns.catplot(x="survived",y="age",hue=None,row=None,col=None,
              data=df,kind=j,ax=axes[i]) 
#hue对X轴进行二次分组,row按行分面,row按列分面,kind控制图形种类,
#有strip,swarm,box,violin,boxen,point,bar,count,strip为默认值

fig,axes=plt.subplots(3,3,figsize=(30,24))
ax=axes.flatten()
sns.stripplot(x="survived",y="age",data=df,ax=ax[0]) #条形散点图
sns.swarmplot(x="survived",y="age",data=df,ax=ax[1]) #避免散点重叠的条形散点图
sns.boxplot(x="survived",y="age",data=df,ax=ax[2]) #箱线图
sns.countplot(x="survived",data=df,ax=ax[3]) #统计图
sns.barplot(x="survived",y="age",data=df,ax=ax[4]) #条形图
sns.violinplot(x="survived",y="age",data=df,ax=ax[5]) #小提琴图
sns.boxenplot(x="survived",y="age",data=df,ax=ax[6]) #增强箱图
sns.pointplot(x="survived",y="age",data=df,ax=ax[7]) #点图

上图为八种不同的分类图。

  • distplot

直方图是较为特殊的分类关系图,虽然它属于分布函数,但也可视为一种分类。该函数通过hist和kde参数可控制绘制的图是直方图还是密度图,或是二者的结合。

fig,axes=plt.subplots(1,2,figsize=(12,5))
sns.distplot(df["age"],bins=[0,20,40,60,80,100],hist=True,kde=False,ax=axes[0]) 
sns.distplot(df["age"],bins=[0,20,40,60,80,100],hist=False,kde=True,ax=axes[1]) 


sns.kdeplot(df["age"],shade=True,vertical=False) 
#核密度曲线


组合关系可视化


组合关系包含的都是一些较为复杂的图,本文介绍三种。

  • pairplot

该函数主要描述数据变量两两之间的关系图,默认都是散点图。

sns.heatmap(data=df[["age","sex","pclass","fare"]].corr(),linecolor="white",annot=True,linewidths=0.1,cmap='YlGnBu')
#cmap即colormap plt的颜色对象,annot系数值是否显示,
#矩阵数据集,行为矩阵的列名称,列为矩阵的行索引,如果是dataframe,则行为行索引
  • heatmap

热力图是一款非常热门的图形,通过颜色来反映数据之间的关系。

sns.heatmap(data=df[["age","sex","pclass","fare"]].corr(),linecolor="white",
            annot=True,linewidths=0.1)
#annot系数值是否显示
#data最后是矩阵数据集,图形的行为矩阵的列,列为矩阵的行索引,如果是dataframe,则行为行索引


  • factorplot与FacetGrid

这是两个分面函数,分面的意思就是在一张画布中画多个图形。

sns.factorplot(x="survived", y="age",row="sex",col="pclass", 
               data=df, kind="strip")
#多面板绘图
g=sns.FacetGrid(data=df,row="sex",col="pclass") #先画出轮廓
g.map(sns.stripplot,"survived","age") #进行补充

其实这些分面图形通过catplot方面也是可以实现的。

sns.catplot(x="survived",y="age",col="pclass",hue=None,
            row="sex",kind='strip',data=df)



结语


将这些方法进行归类后就会发现,熟记并掌握这些函数变得容易多了。其实,可视化的原理并不复杂,复杂的只是绘图细节部分。因为每种组成部分都有众多的参数,参数还有不同的取值。

当然了,常规的可视化需求我们采用默认设置就足够了!

相关推荐

GANs为何引爆机器学习?这篇基于TensorFlow的实例教程为你解惑!

「机器人圈导览」:生成对抗网络无疑是机器学习领域近三年来最火爆的研究领域,相关论文层出不求,各种领域的应用层出不穷。那么,GAN到底如何实践?本文编译自Medium,该文作者以一朵玫瑰花为例,详细阐...

高丽大学等机构联合发布StarGAN:可自定义表情和面部特征

原文来源:arXiv、GitHub作者:YunjeyChoi、MinjeChoi、MunyoungKim、Jung-WooHa、SungKim、JaegulChoo「雷克世界」编译:嗯~...

TensorFlow和PyTorch相继发布最新版,有何变化

原文来源:GitHub「机器人圈」编译:嗯~阿童木呀、多啦A亮Tensorflow主要特征和改进在Tensorflow库中添加封装评估量。所添加的评估量列表如下:1.深度神经网络分类器(DNNCl...

「2022 年」崔庆才 Python3 爬虫教程 - 深度学习识别滑动验证码缺口

上一节我们使用OpenCV识别了图形验证码躯壳欧。这时候就有朋友可能会说了,现在深度学习不是对图像识别很准吗?那深度学习可以用在识别滑动验证码缺口位置吗?当然也是可以的,本节我们就来了解下使用深度...

20K star!搞定 LLM 微调的开源利器

LLM(大语言模型)微调一直都是老大难问题,不仅因为微调需要大量的计算资源,而且微调的方法也很多,要去尝试每种方法的效果,需要安装大量的第三方库和依赖,甚至要接入一些框架,可能在还没开始微调就已经因为...

大模型DeepSeek本地部署后如何进行自定义调整?

1.理解模型架构a)查看深度求索官方文档或提供的源代码文件,了解模型的结构、输入输出格式以及支持的功能。模型是否为预训练权重?如果是,可以在预训练的基础上进行微调(Fine-tuning)。是否需要...

因配置不当,约5000个AI模型与数据集在公网暴露

除了可访问机器学习模型外,暴露的数据还可能包括训练数据集、超参数,甚至是用于构建模型的原始数据。前情回顾·人工智能安全动态向ChatGPT植入恶意“长期记忆”,持续窃取用户输入数据多模态大语言模型的致...

基于pytorch的深度学习人员重识别

基于pytorch的深度学习人员重识别Torchreid是一个库。基于pytorch的深度学习人员重识别。特点:支持多GPU训练支持图像的人员重识别与视频的人员重识别端到端的训练与评估简单的re...

DeepSeek本地部署:轻松训练你的AI模型

引言:为什么选择本地部署?在AI技术飞速发展的今天,越来越多的企业和个人希望将AI技术应用于实际场景中。然而,对于一些对数据隐私和计算资源有特殊需求的用户来说,云端部署可能并不是最佳选择。此时,本地部...

谷歌今天又开源了,这次是Sketch-RNN

前不久,谷歌公布了一项最新技术,可以教机器画画。今天,谷歌开源了代码。在我们研究其代码之前,首先先按要求设置Magenta环境。(https://github.com/tensorflow/magen...

Tensorflow 使用预训练模型训练的完整流程

前面已经介绍了深度学习框架Tensorflow的图像的标注和训练数据的准备工作,本文介绍一下使用预训练模型完成训练并导出训练的模型。1.选择预训练模型1.1下载预训练模型首先需要在Tensorf...

30天大模型调优学习计划(30分钟训练大模型)

30天大模型调优学习计划,结合Unsloth和Lora进行大模型微调,掌握大模型基础知识和调优方法,熟练应用。第1周:基础入门目标:了解大模型基础并熟悉Unsloth等工具的基本使用。Day1:大模...

python爬取喜马拉雅音频,json参数解析

一.抓包分析json,获取加密方式1.抓包获取音频界面f12打开抓包工具,播放一个(非vip)视频,点击“媒体”单击打开可以复制URL,发现就是我们要的音频。复制“CKwRIJEEXn-cABa0Tg...

五、JSONPath使用(Python)(json数据python)

1.安装方法pipinstalljsonpath2.jsonpath与Xpath下面表格是jsonpath语法与Xpath的完整概述和比较。Xpathjsonpath概述/$根节点.@当前节点...

Python网络爬虫的时候json=就是让你少写个json.dumps()

大家好,我是皮皮。一、前言前几天在Python白银交流群【空翼】问了一个Python网络爬虫的问题,提问截图如下:登录请求地址是这个:二、实现过程这里【甯同学】给了一个提示,如下所示:估计很多小伙伴和...