多文本导入今天介绍下如何一次导入71个txt文本,每个文本2列数据,一共142列。希望看完这个不要再一次次复制粘贴了,多次复制又累又容易出错。操作步骤很简单,在Data按钮下面选择impo......
2023-01-12
Python作为常用的数据分析工具,在可视化工具上,有很多优秀的第三方库如matplotlib、seaborn、plotly、cufflinks、boken、pyecharts等。由于matplotlib绘制的图表大多数时候确实不太美观,且使用较古怪,seaborn对matplotlib进行了进一步的封装,它是matplotlib的一个高级API,使用方便。(相当于cufflinks封装了plotly一样)在数据科学竞赛及数据分析领域,matplotlib+seaborn依然是主流的配置,尽管plotly等对其有所冲击(看个人喜好吧)。
运行pip install seaborn
进行安装,Seaborn交互性极强,建议使用jupyter notebook作为IDE。(pip install jupyter
安装,命令行jupyter notebook
启动)
import matplotlib.pyplot as plt import seaborn as sns df = sns.load_dataset('tips') df.head()
Seaborn的最大优点在于其提供了较为美观的各类图表,这也是为什么平时更多使用seaborn而不是matplotlib直接绘制的原因。
plt.figure(figsize=(12, 6)) sns.scatterplot(x='total_bill', y='tip', data=df, hue='day') # 散点图 # sns.stripplot(x='total_bill', y='tip', data=df, hue='day') # 分类散点图 # sns.swarmplot(x='total_bill', y='tip', data=df, hue='day') # 分簇散点图
plt.figure(figsize=(12, 6)) sns.lineplot(x='total_bill', y='tip', data=df, size=6)
plt.figure(figsize=(12, 6)) sns.barplot(x='size', y='tip', data=df)
plt.figure(figsize=(12, 6)) sns.countplot(df['day'])
plt.figure(figsize=(12, 6)) sns.distplot(df['tip'])
plt.figure(figsize=(8, 4)) sns.boxplot(data=df) plt.figure(figsize=(8, 4)) sns.boxenplot(data=df)
plt.figure(figsize=(12, 6)) sns.heatmap(df.corr())
针对数据可视化的不同目的,seaborn提供了relplot(),catplot(),displot(),lmplot()四大主要高级函数。
plt.figure(figsize=(12, 8)) sns.relplot(x='total_bill', y='tip', data=df, hue='day')
plt.figure(figsize=(12, 8)) sns.catplot(x='total_bill', y='day', data=df)
plt.figure(figsize=(12, 8)) sns.lmplot(x='total_bill', y='tip', data=df, height=6, fit_reg=True, hue='day')
Seaborn是基于matplotlib的封装,很多底层的定制仍然需要使用matplotlib定制,如label、lim等。
plt.figure(figsize=(12, 6)) sns.lineplot(x='total_bill', y='tip', data=df, size=6) plt.xlim(10, None)
plt.figure(figsize=(16, 6)) plt.subplot(1, 2, 1) sns.set_style('darkgrid') sns.heatmap(df.corr()) plt.subplot(1, 2, 2) sns.set_style('whitegrid') sns.heatmap(df.corr(), cmap='YlGnBu')
相关文章
多文本导入今天介绍下如何一次导入71个txt文本,每个文本2列数据,一共142列。希望看完这个不要再一次次复制粘贴了,多次复制又累又容易出错。操作步骤很简单,在Data按钮下面选择impo......
2023-01-12
今天教大家如何绘制时间轴图,并展示网格线的使用方法和坐标后缀的编辑。通常,在GraphPad中的Column中,新建一组数据后,会自动生成散点图,然后对其进行相应的编辑,即可将一张散点图......
2023-01-12
在Origin软件绘图过程中经常会遇到以下情况,比如图表中出现很大一块空白区,这样既浪费空间,也使得数据不集中影响查看数据和排版的美观。为了使得数据更易读并节省空间,可以用设置......
2023-01-12
1、打开软件,选择空白;自动生成的表格只有两列,如果你的数据组多,可以在页面空白处单击鼠标右键增加新列,就出现很多啦。然后,将整理好的数据粘贴进来2、生成图形;全选需要做......
2023-01-12
Endnote是科研小伙伴们写作论文时最常用、功能最强大的文献管理软件之一。用Endnote写作中文论文,比如中文期刊论文、硕博士毕业论文,可以说是每一个科研小伙伴们的必修课。但由于......
2023-01-12