朴素贝叶斯分类器基于iris及Python手写实现

🕗 发布于 2024-11-13 03:10 python 机器学习

数据来源为sklean.datasets中的load_iris，代码如下：

# -*- coding:utf-8 -*-
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 参考：https://blog.csdn.net/weixin_66845445/article/details/138135601
class bayes_iris():
    def __init__(self):
        pass

    def loadData(self):
        iris = load_iris()
        dataSet = iris.data
        target = iris.target
        X_train,X_test,y_train,y_test = train_test_split(dataSet, target, test_size=0.3,random_state=37)
        labels = np.array(sorted(list(set(y_train))))

        return X_train,X_test,y_train,y_test,labels

    '''
    分类值有三个，分别计算每个属性在三个分类值下的条件概率
    '''
    def cal(self,test,col_index,labels,X,y):
        result = np.zeros((labels.shape[0],),dtype=np.float64)
        for index ,label in zip(range(len(labels)), labels):
            arr = np.array(list(zip(*X[y == label])))[col_index,:]
            mean = np.mean(arr)
            std = np.std(arr)
            result[index] = (1 / (np.sqrt(2 * np.pi)* std)) * np.exp(-1* (((test - mean)**2) / (2 * (std**2))))

        return result

    def pred(self,X_train,X_test,y_train,labels):

        countAll = y_train.shape[0]
        P0 = len(y_train[y_train == 0]) / countAll
        P1 = len(y_train[y_train == 1]) / countAll
        P2 = len(y_train[y_train == 2]) / countAll

        P = np.array([P0,P1,P2]).reshape(3,1)

        y_pred = np.zeros(X_test.shape[0], dtype=np.int8)
        for i in range(X_test.shape[0]):
            # result.shape = (3,4)
            result = np.zeros((labels.shape[0],X_test.shape[1]), dtype=np.float64)
            for j in range(X_test.shape[1]):
                result[:,j] = self.cal(X_test[i,j],j,labels=labels, X=X_train,y=y_train)
            result = np.concatenate((P,result), axis=1)
            y_pred[i] = labels[np.argmax(np.prod(result, axis=1))]

        return y_pred
    
if __name__ == '__main__':
    iris = bayes_iris()
    X_train,X_test,y_train,y_test,labels = iris.loadData()
    y_pred = iris.pred(X_train,X_test,y_train,labels)
    print(accuracy_score(y_test, y_pred=y_pred))

输出结果如下：

1.0

参考：https://blog.csdn.net/weixin_66845445/article/details/138135601

原文地址：https://blog.csdn.net/bo_hai/article/details/143625931

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

设计模式之装饰器模式(SSO单点登录功能扩展，增加拦截用户访问方法范围场景)
不改变原有类，可能有的小伙伴会想到继承、AOP切面，当然这些方式都可以实现，但是使用装饰器模式会是另外一种思路更为灵活，可以避免继承导致的子类过多，也可以避免AOP带来的复杂性。就像夏天热你穿短裤，冬
阅读更多2024-11-15
MySQL45讲第二十三讲是怎么保证数据不丢的？
在 MySQL 的世界里，数据的可靠性是至关重要的。今天，我们将深入探讨 MySQL 是如何保证数据不丢的，这涉及到 binlog 和 redo log 的写入机制，以及一些关键参数的设置。
阅读更多2024-11-15
【Electron】Electron Forge如何支持Element plus？
在 Electron Forge 项目中集成 Element Plus 是一个相对直接的过程。Element Plus 是一个基于 Vue 3 的 UI 组件库，因此你需要确保你的 Electron
阅读更多2024-11-15
jupyter可视化pandas dataframe
在Jupyter中显示HTML表格。
阅读更多2024-11-15
如何使用Jupyter
Jupyter Notebook 是一个开源的 Web 应用程序，允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。Jupyter Notebook 还支持许多高级功能，如魔法命令、扩展、
阅读更多2024-11-15
利用飞书多维表格自动发布版本
飞书的多维表格有自动化的能力，我们每周只需要设定好版本发布的时间，可以让其自动触发版本发布，并在群里通知所有人。那么假定我们每隔10分钟获取一次，除非在发版前10分钟内修改发版计划，否则都能感知到版本
阅读更多2024-11-15
SQL Server Service Broker完整示例
SQL server Service Broker实战
阅读更多2024-11-15
QT鼠标事件
这篇文章介绍如何使用事件和获取事件的信号。
阅读更多2024-11-15
基于Python+Vue开发的旅游景区管理系统
该项目是基于Python+Vue开发的旅游景区管理系统（前后端分离），这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Python编程技能，同时锻炼他们的项目设计与开发能力。通
阅读更多2024-11-15
2023年12月中国电子学会青少年软件编程（Python）等级考试试卷（三级）答案 + 解析
2023年12月中国电子学会青少年软件编程（Python）等级考试试卷（三级）答案 + 解析
阅读更多2024-11-15

朴素贝叶斯分类器基于iris及Python手写实现

数据来源为sklean.datasets中的load_iris，代码如下：

输出结果如下：

相关文章