自学内容网 自学内容网

【天池比赛】【零基础入门金融风控 Task2赛题理解】【2.3.6】

【天池比赛】【零基础入门金融风控 Task2赛题理解】【2.3.1-2.3.5】

2.3.6 变量分布可视化

2.3.6.1 单一变量分布可视化

对于 pandas.core.series.Series 类型的变量:

  • index:含义:它表示 Series 对象的索引,也就是每个数据点对应的标签。索引可以是整数、字符串、日期时间等各种类型。

  • .values:含义:它返回一个 numpy.ndarray 对象,包含了 Series 中的数据值。

  • palette参数为一个包含颜色代码的列表,为每个柱子分配了不同的颜色。你可以根据自己的喜好调整颜色代码
palette = ['#FF69B4', '#87CEFA', '#FFD700', '#98FB98', '#FFA07A', '#DA70D6', '#6A5ACD', '#2E8B57']
plt.figure(figsize=(8, 8))
sns.barplot(y=data_train["employmentLength"].value_counts(dropna=False)[:20].index,x=data_train["employmentLength"].value_counts(dropna=False)[:20].values,palette=palette)
plt.show()

运行结果:


原文地址:https://blog.csdn.net/qq_25964837/article/details/143086583

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!