数据处理方法--OrdinalEncoder自然数排序

🕗 发布于 2024-02-05 19:24 python 数据分析 机器学习

实现原理

首先是自然数排序方法，该方法的过程较为简单，即先对离散字段的不同取值进行排序，然后对其进行自然数值取值转化，例如下述过程：
在这里插入图片描述

实现过程

可以直接考虑调用sklearn中的OrdinalEncoder()评估器（转化器）。

from sklearn import preprocessing

# 和所有的sklearn中转化器使用过程类似，需要先训练、后使用：
X1 = np.array([['F'], ['M'], ['M'], ['F']])

# 实例化转化器
enc = preprocessing.OrdinalEncoder()

# 在X1上训练
enc.fit(X1)

# 对X1数据集进行转化
enc.transform(X1)
# 运行结果
# array([[0.],
#        [1.],
#        [1.],
#        [0.]])

# 当然，该评估器的训练过程就相当于记录了原分类变量不同取值和自然数之间的对应关系，我们可以调用转化器如下属性来查看映射关系：
enc.categories_
# [array(['F', 'M'], dtype='<U1')]

原文地址：https://blog.csdn.net/asddoa/article/details/136027945

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：高项&PMP证书在IT领域的作用
下一篇：只适用于ARPL和其它USB引导写盘

The 14th Jilin Provincial Collegiate Programming Contest
【代码】The 14th Jilin Provincial Collegiate Programming Contest。
阅读更多2024-10-05
Excel常用函数
Excel常用函数说明
阅读更多2024-10-05
【Git】克隆主项目，并同时克隆所有子模块
带有箭头的文件夹（）通常表示这是一个 Git 子模块（submodule）。Git 子模块是一种嵌入式的 Git 仓库，它允许你在一个仓库中引用其他的 Git 仓库。换句话说，不是这个项目自身的文件夹
阅读更多2024-10-05
基础算法之滑动窗口--Java实现(上)--LeetCode题解:长度最小的子数组-无重复字符的子串-最大连续1的个数III-将x减到0的最小操作数
滑动窗口。
阅读更多2024-10-05
【Python】Arrow使用指南：轻松管理日期与时间
Arrow 是一个基于 Python 的日期与时间管理库，提供了更人性化和直观的 API 处理时间数据。与 Python 标准库中的 `datetime` 模块相比，Arrow 极大地简化了时间创建、
阅读更多2024-10-05
CANoe_trace介绍以及如何使用C#仿制trace方案介绍
是由Vector Informatik公司开发的一款专业的网络分析与仿真工具，广泛应用于汽车电子系统中的CAN、LIN、FlexRay等多种通信协议的开发、测试与诊断。通过捕捉和分析网络上的数据帧，C
阅读更多2024-10-05
uniapp中实现评分组件，多用于购买商品后，对商品进行评价等场景
uni-rate组件可以根据设定的星星总数，展示用户评分的效果，用户可以通过点击星星或滑动星星的方式进行评分。5、透明度：Uni-rate评级过程和标准具有一定的透明度，投资者和利益相关者可以了解评级
阅读更多2024-10-05
50. GLTF格式简介 (Web3D领域JPG)
GLTF格式是新2015发布的三维模型格式，随着物联网、WebGL、5G的进一步发展，会有越来越多的互联网项目Web端引入3D元素，你可以把GLTF格式的三维模型理解为.jpg、.png格式的图片一样
阅读更多2024-10-05
前端——测试与打包时静态资源引用路径
public路径与绝对路径说明，原理：在Vite中， / 开头的绝对路径默认可以访问到 public/ 目录下的内容，所以 /public/static/home/首页.png 和 /static/h
阅读更多2024-10-05
【网络安全】IP切换绕过2FA身份验证
分析返回的响应时，我发现有效的 OTP 响应比无效的响应稍长，这表明我们成功绕过了2FA验证机制。
阅读更多2024-10-05

数据处理方法--OrdinalEncoder自然数排序

实现原理

实现过程

相关文章