如何选择聚类算法、回归算法、分类算法？

🕗 发布于 2024-11-21 06:17 算法聚类回归分类 机器学习

如何选择聚类算法

如果数据集是高维的 —— 谱聚类，它是子空间划分的一种。
如果数据是中小规模：
100万以内 —— K_Means
100万以上 —— MiniBatchKMeans（每类抽取一部分样本聚类，精度下降，速度提高）
数据集中有噪声（离群点） —— 基于密度的带有噪声的 DBSCAN 。
如果追求更高的分类准确性，选择谱聚类比K_Means准确性更好。

如何选择回归分析算法

数据集本身结构简单、分布规律有明显线性关系——简单线性回归，基于最小二乘法的普通线性回归。
自变量数量少或降维后得到了二维变量（包括预测变量）——直接使用散点图，发现自变量和因变量之间的相互关系，然后再选择最佳回归方法
自变量间有较强共线性关系——岭回归，L2正则化，对多重共线性灵活处理的方法
如果噪声较多——推荐主成分回归，通过对参与回归的主成分的合理选择，可以去掉噪声；各个主成分相互正交，解决多元回归共线性问题。
高维度变量下——正则化回归方法，Lasso、Ridge、ElasticNet。降维、逐步回归
可使用交叉验证做多个模型的效果对比，验证多个算法
注重模型的可解释性—— 线性回归、逻辑回归、对数回归、二项式或多项式回归
集成或组合方法——加权、均值等方法确定最终输出结果（一旦确认来多个方法，又不确定取舍）

如何选择分类分析算法

文本文类——朴素贝叶斯
训练集较小——朴素贝叶斯、支持向量机，高偏差低方差低分类算法，不容易过拟合
训练集较大——基本都适用
关注模型等计算时间和模型易用性——不用支持向量机和人工神经网络
重视算法准确性——支持向量机、GBDT、XGBoost、Adaboost等基于Boosting等集成方法
重视算法稳定性或模型鲁棒性——随机森林、组合投票模型等基于Bagging的集成方法
预得到预测结果的概率信息，基于预测概率做进一步应用——逻辑回归
担心离群点或数据不可分并且需要清晰的决策规则——决策树

原文地址：https://blog.csdn.net/rubyw/article/details/143904450

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【数据结构OJ】【图论】货币套汇（图路径）
下一篇：MongoDB数据备份与恢复（内含工具下载、数据处理以及常见问题解决方法）

MySQL系列之身份鉴别（安全）
MySQL的身份鉴别是数据库安全的核心命题之一。在每日“拧螺丝”的工作中，我们的开发人员可能会忽略这个问题。正因如此，博主以这个契机，向大家做一次专题介绍。看过此文，相信你能够“上应付得了等保，下对得
阅读更多2024-11-21
uni app下开发AI运动小程序解决方案
开发者可以根据实际需求，自由选择并调用相应的接口，以实现丰富的功能，如通过相机抽帧控制来精确捕捉画面，利用人体识别技术来检测并跟踪人体动作，或是通过姿态识别与相似度比较功能来分析并比较用户的体态特征，
阅读更多2024-11-21
AI时代，百度的三大主义
这样的表态，在当时的环境下需要极大的勇气，事后证明，这其实就是全球主流的AI方向。目前在百度智能云的千帆大模型平台上，已经累计精调了3.3万个大模型，开发出了77万个企业级应用，百度智能云已经拥有中国
阅读更多2024-11-21
nwjs崩溃复现、 nwjs-控制台手动操纵、nwjs崩溃调用栈解码、剪切板例子中、nwjs混合模式、xdotool显示nwjs所有进程窗口列表
nwjs崩溃调用栈解码
阅读更多2024-11-21
【设计模式】【创建型模式（Creational Patterns）】之单例模式
这些实现都遵循了单例模式的基本原则：确保一个类只有一个实例，并提供一个全局访问点。每种语言的实现方式有所不同，但核心思想是一致的。
阅读更多2024-11-21
C++篇之多态
类成员函数前⾯加virtual修饰，那么这个成员函数被称为虚函数。注意⾮成员函数不能加virtual修饰。
阅读更多2024-11-21
java 设计模式模板方法模式
java 设计模式，模板方法模式，springboot，SpringCloudAlibaba，Springboot+Vue
阅读更多2024-11-21
Vue前端开发子组件向父组件传参
在父组件中，如果需要获取子组件中的数据，有两种方式，一种是在子组件中自定义事件，父组件绑定该事件，当触发自定义事件时，向父组件传入参数；另一种是先通过ref属性给子组件命名，然后在父组件中就可以调用$
阅读更多2024-11-21
【STM32】时钟系统
在我们学习STM32之前，我们需要先了解STM32系列芯片的时钟系统，这个是我们学习这个芯片的基础。为什么时钟系统这么重要呢？举个例子，如果把STM32比作我们的整个人体，那么时钟就是维持我们人体正常
阅读更多2024-11-21
华为云鸿蒙应用入门级开发者认证考试题库(理论题和实验题）
华为云鸿蒙应用入门级开发者认证题库，包含了大部分HCCDA考试认证题目
阅读更多2024-11-21

如何选择聚类算法、回归算法、分类算法？

相关文章