自学内容网 自学内容网

多样化数据可视化方法的全面示例:基于Python的多样化数据可视化


前言

本文演示了使用Python进行温度数据的多样化可视化方法。通过导入、处理和分析气象数据,我们生成了多种图表,包括直方图、核密度估计图、箱型图、小提琴图、条形图、山脊图、经验累积分布函数图和折线图。这些图表帮助我们更直观地理解温度数据的分布和变化趋势。我们利用了Seaborn、Matplotlib和Plotly等数据可视化库,以美观和易于理解的方式展示数据。

代码

# Import necessary libraries
import pandas as pd
from pandas.api.types import CategoricalDtype
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px
from joypy import joyplot

# 导入数据
df = pd.read_csv('D:/Pythonmatlab/2326060760python数据分布/weatherData.csv')

# 设置季节为分类数据类型
season = CategoricalDtype(['Winter', 'Spring', 'Summer', 'Fall'])
df['Season'] = df['Season'].astype(season)

# 打印前5行数据
print(df.head(5))

#%%
# 直方图

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成直方图
sns.histplot(df, x='Temp')

# 显示图表
plt.show()

#%%
# 分地点的堆叠直方图

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成堆叠直方图
sns.histplot(df, x='Temp', hue='Location', multiple='stack')

# 设置标签
plt.title('Distribution of All Observed Temperatures', fontsize=25, y=1.03)
plt.xlabel('Temperature (F)', fontsize=13)
plt.ylabel('Count', fontsize=13)

# 显示图表
plt.show()

#%%
# 分季节的直方图

# 生成分季节的直方图
g = sns.displot(df, x='Temp', col='Season', hue='Location', 
                multiple='stack', binwidth=5, height=3, col_wrap=2, 
                facet_kws=dict(margin_titles=False))

# 设置轴标签
g.set_axis_labels('Temperature (F)', 'Count')

# 显示图表
plt.show()

#%%
# 分季节的垂直直方图

# 生成分季节的垂直直方图
g = sns.displot(df, x='Temp', col='Season', hue='Location',
                multiple='stack', binwidth=5, height=1, aspect=6,
                col_wrap=1, facet_kws=dict(margin_titles=True))

# 设置轴标签
g.set_axis_labels('Temperature (F)', 'Count', fontsize=17)

# 显示图表
plt.show()

#%%
# Plotly直方图

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成Plotly直方图
plot = px.histogram(df, x='Temp',
                    barmode='overlay', color='Location', facet_row='Season')

# 设置标题和标签
plot.update_layout(title={'text': "Distributions of Temperature\
                                  <br><sup>Sorted by Season and \
                                  Location</sup>",
                          'xanchor': 'left',
                          'yanchor': 'top',
                          'x': 0.1}, legend_title_text='Location',
                   xaxis_title='Recorded Temperature (F)')
plot.for_each_annotation(lambda x: x.update(text=x.text.split("=")[1]))
plot.update_yaxes(title='Count')

# 设置颜色和背景
plot.update_layout(plot_bgcolor='white')
plot.update_xaxes(showline=True, linecolor='gray')
plot.update_yaxes(showline=True, linecolor='gray')

# 显示图表
plot.show()

#%%
# 核密度估计图(KDE Plots)

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成KDE图
sns.kdeplot(data=df, x='Temp', hue='Location', fill=False)

# 设置标签
plt.title('KDE Plot of Temperatures', fontsize=25, y=1.03)
plt.xlabel('Temperature (F)', fontsize=13)
plt.ylabel('Density', fontsize=13)

# 显示图表
plt.show()

#%%
# 分季节的KDE图

# 生成分季节的KDE图
g = sns.displot(df, x="Temp", col="Season", hue='Location',
                kind='kde', height=1, aspect=7, col_wrap=1,
                fill=True, facet_kws=dict(margin_titles=True))

# 设置轴标签
g.set_axis_labels('Temperature (F)', 'Density', fontsize=16)

# 显示图表
plt.show()

#%%
# 分季节的带填充KDE图

# 生成分季节的带填充KDE图
g = sns.displot(df, x="Temp", col="Season", hue='Location', 
                kde=True, height=1, aspect=7, col_wrap=1, 
                fill=True, facet_kws=dict(margin_titles=True))

# 设置轴标签
g.set_axis_labels('Temperature (F)', 'Density', fontsize=16)

# 显示图表
plt.show()

#%%
# 山脊图(Joy Plots or Ridge Plots)

# 重塑数据
dfJoy = df.pivot(index=['Entry', 'Season'], columns='Location', values='Temp')
print(dfJoy.head())

# 生成山脊图
fig, axes = joyplot(data=dfJoy,
                    by='Season',
                    column=['City A', 'City B', 'City C'],
                    color=['#43bf60', '#2b7acf', '#f59f0a'],
                    alpha=.67,
                    legend=True,
                    overlap=2,
                    linewidth=.5,
                    figsize=(10, 6))

# 设置标签
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 箱型图(Box Plots)

# 生成箱型图
plot = px.box(df, x='Season', color='Location', y='Temp', 
              color_discrete_sequence=px.colors.cyclical.IceFire)

# 更新布局和标题
plot.update_layout(title={'text': "Seasonal Temperature Distributions\
                                  <br><sup>By Season for Cities A, B, \
                                  and C</sup>",
                          'xanchor': 'left',
                          'yanchor': 'top',
                          'x': 0.1}, legend_title_text='Location:',
                   xaxis_title='',
                   yaxis_title='Temperature (F)')

# 更新样式
plot.update_layout(plot_bgcolor='white')
plot.update_xaxes(showline=True, linecolor='gray')
plot.update_yaxes(showline=True, linecolor='gray')

# 显示图表
plot.show()

#%%
# 小提琴图(Violin Plots)

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成小提琴图
sns.violinplot(data=df, x='Temp', y='Season', hue='Location',
               inner='quartile', palette='Set2')

# 设置标签
plt.title('Violin Plot of Observed Temperatures', fontsize=25, y=1.01)
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 分类数据散点图(Strip and Swarm Plots)

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成strip plot
sns.stripplot(data=df, x='Temp', y='Season', hue='Location', jitter=True, 
              palette="magma", alpha=.75)

# 设置标签
plt.title('Strip Plot of Observed Temperatures', fontsize=25, y=1.01)
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成strip plot(带dodge选项)
sns.stripplot(data=df, x='Temp', y='Season', hue='Location', jitter=True, 
              palette="magma", dodge=True, alpha=.5)

# 设置标签
plt.title('Strip Plot of Observed Temperatures', fontsize=25, y=1.01)
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成swarm plot
sns.swarmplot(data=df, x='Temp', y='Season', hue='Location', 
              palette='magma')

# 设置标签
plt.title('Swarm Plot of Observed Temperatures', fontsize=25, y=1.01)
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成swarm plot(带dodge选项)
sns.swarmplot(data=df, x='Temp', y='Season', hue='Location', 
              palette='magma', dodge=True)

# 设置标签
plt.title('Swarm Plot of Observed Temperatures', fontsize=25, y=1.01)
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 经验累积分布函数图(ECDF Plots)

# 生成ECDF图
sns.displot(df, x='Temp', hue='Location', kind='ecdf', height=5)

# 设置标签
plt.xlabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 分季节的ECDF图

# 生成分季节的ECDF图
g = sns.displot(df, x='Temp', hue='Location', col='Season', kind='ecdf', height=4)

# 设置轴标签
g.set_axis_labels('Temperature (F)', 'Cumulative Distribution')

# 显示图表
plt.show()

#%%
# 折线图(Line Plots)

# 设置图表大小
plt.figure(figsize=(10, 6))

# 生成折线图
sns.lineplot(data=df, x='Entry', y='Temp', hue='Location', 
             ci=None, palette='tab10')

# 设置标签
plt.title('Temperature Trends Over Time', fontsize=25, y=1.01)
plt.xlabel('Entry', fontsize=13)
plt.ylabel('Temperature (F)', fontsize=13)

# 显示图表
plt.show()

#%%
# 分季节的折线图

# 生成分季节的折线图
g = sns.relplot(data=df, x='Entry', y='Temp', hue='Location', kind='line', 
                col='Season', col_wrap=1, height=4, aspect=5, facet_kws=dict(margin_titles=True))

# 设置轴标签
g.set_axis_labels('Entry', 'Temperature (F)', fontsize=16)

# 显示图表
plt.show()

#%%
# 分地点的折线图

# 生成分地点的折线图
g = sns.relplot(data=df, x='Entry', y='Temp', hue='Season', kind='line',
                col='Location', col_wrap=1, height=4, aspect=5, facet_kws=dict(margin_titles=True))

# 设置轴标签
g.set_axis_labels('Entry', 'Temperature (F)', fontsize=16)

# 显示图表
plt.show()

# Create Displot:
g = sns.displot(df, x='Temp', col='Season', hue='Location',
                kind='ecdf', height=3, col_wrap=2,
                facet_kws=dict(margin_titles=True))

# Set labels:
# g.fig.suptitle('Distributions of Temperature by Season',
#                fontsize=25, x=0.47, y=1.03, ha='center')
g.set_axis_labels('Temperature (F)', 'Count')
plt.show()
#%%

df = sns.load_dataset('iris')

# Plot
plt.figure(figsize=(10, 8), dpi=80)
sns.pairplot(df,
             kind="scatter",
             hue="species",
             palette='Set1',
             plot_kws=dict(s=80, edgecolor="white", linewidth=2.5))
plt.show()


#%%
df = sns.load_dataset('iris')

# Plot

sns.pairplot(df)
plt.show()
# 导入鸢尾花数据集
df = sns.load_dataset('iris')

# 绘制配对图
plt.figure(figsize=(10, 8), dpi=80)
sns.pairplot(df,
             kind="scatter",
             hue="species",
             palette='Set1',
             plot_kws=dict(s=80, edgecolor="white", linewidth=2.5))
plt.show()

#%%
# 再次导入鸢尾花数据集
df = sns.load_dataset('iris')

# 绘制简单的配对图
sns.pairplot(df)
plt.show()

效果展示

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


原文地址:https://blog.csdn.net/frankgis/article/details/140432443

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!