知识点梳理-sklearn进行数据集的获取, 划分和可视化

🕗 发布于 2024-10-13 08:00 信息可视化 机器学习 sklearn 分类 python

Scikit-learn数据集获取
   1.获取数据集
       sklearn.datasets
       1.小数据集
           sklearn.datasets.load_*()
           从本地获取
       2.大数据集
           sklearn.datasets.fetch_*()
           从网上下载
           subset--表示获取的数据集类型(train/test/all)
           默认下载训练数据集(train)
   2.数据集返回值
       返回类型为bunch--字典类型
       返回值属性:
           data:特征数据数组
           target:目标数组
           feature_names: 特征名
           target_names: 目标名
           DESCR: 数据集介绍
   3.数据可视化
       import seaborn as sns
       sns.Implot()
       参数:
       x, y--具体x/y轴索引值(列名)
       data--数据集的具体数据
       hue--目标值(列名)
       fit_reg--是否进行线性拟合, 默认为True, 英文全称fit regression
   4.数据集划分
       from sklearn.selection import train_test_split()
       参数:
       x--特征值数据
       y--目标值数据
       test_size-测试集所占比例(0.2-0.3为宜)
       random_state--产生随机数种子, 确保每次划分的结果一致
       返回值:
       返回值内容顺序:
           1.训练集特征值 x_train
           2.测试集特征值 x_test
           3.训练集目标值 y_train
           4.测试集目标值 y_test

jupyter常用快捷键:
1.查看函数参数:
将光标放在函数名或参数后面,按住Shift+Tab键，会弹出函数帮助文档窗口。

原文地址：https://blog.csdn.net/JR521314/article/details/142742419

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：矫平机：工业制造中的平整专家
下一篇：5、Spring Boot 3.x 集成 RabbitMQ

2024年黑客技术与网络安全自学三月提升攻略
网络安全可以基于攻击和防御视角来分类，我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。走安全行业的工程方向的，技术上面其实有很大的重叠
阅读更多2024-10-13
ESP32-C3实现热点并把热点设置指定的IP（热点静态IP）
引入库文件：定义热点信息：创建Web服务器实例：设置函数（setup）：主循环函数（loop）：
阅读更多2024-10-13
Star Tower Chain：以数据治理驱动区块链创新
根据用户的反馈和需求，不断改进数据服务。例如，在医疗领域，通过对患者的医疗数据进行分析，可以为医生提供更加精准的诊断和治疗方案，提高医疗质量和效率。同时，建立数据质量反馈机制，鼓励用户参与数据质量的监
阅读更多2024-10-13
算法：525.连续数组
在该题中，要寻找一个连续子数组，使得其中含有相同数量的0和1,0变成-1之后，也就是，含有相同数量的-1和1，也就是我们需要再 [0 , i - 1] 这个区间里面寻找一个最短的前缀和等于 sum -
阅读更多2024-10-13
refresh-1
当设备检查目标端口上的待处理主动命令时，eUICC应在目标端口上向设备发送REFRESH主动命令，使用“eUICC配置文件状态变更”模式（如果设备支持）或“UICC重置”模式，目标配置文件应在该端口上
阅读更多2024-10-13
单脉冲阵列和差波束形成实现比幅测角法（MATLAB仿真）
单脉冲雷达天线要求产生一个主瓣的和波束，以及具有两个主瓣的差波束。差波束的两个峰值之间的最小值称为“零值”。和波束的作用是探测目标的距离(rrr)并进行距离跟踪，差波束的作用是探测目标的方位角和俯仰角
阅读更多2024-10-13
怎么测试租用的美国服务器是不是超负荷?
在终端中输入vmstat，然后按回车键即可看到美国服务器虚拟内存的使用情况，其中si和so列分别表示交换分区的读和写次数，如果这两个值较大，说明美国服务器可能存在内存不足的情况。在top命令的输出结果
阅读更多2024-10-13
81 NAT-静态NAT
3 测试无法ping 通 202.38.1.100。4 接口上开启静态Nat'映射规则。2 配置nat 静态映射。7 查看NAT 会话状态。8 静态NAT 配置脚本。1 配置接口的IP地址。
阅读更多2024-10-13
MySQL8.0是如何使用SSL/TLS加密提高数据库的安全性的？
在 MySQL 8.0 中，使用 SSL/TLS 加密可以显著提高数据库连接的安全性。
阅读更多2024-10-13
FileUtil工具类
【代码】FileUtil工具类。
阅读更多2024-10-13

知识点梳理-sklearn进行数据集的获取, 划分和可视化

相关文章