从0开始机器学习--Day16--神经网络作业

🕗 发布于 2024-11-08 05:47 机器学习 神经网络 人工智能

题目：构建逻辑回归模型来识别数字0-9

代码如下：

import numpy as np
from scipy.io import loadmat
import scipy.optimize as opt
from sklearn.metrics import classification_report

# 定义函数sigmoid，方便后续假设函数以sigmoid（z）表示
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# 定义代价函数
def computeCost (theta, X, y, l=1 ):
    predictions = sigmoid(X @ theta)
    first = y * np.log(predictions)
    second = (1 - y) * np.log(1 - predictions)
    reg = theta[1:]@theta[1:]*(l/(2*len(X)))   #正则化项
    return -np.sum(first + second)/len(X) +reg  # 返回标量

def gradient(theta, X, y, l=1):
    reg = theta[1:] * (l/len(X))
    reg = np.insert(reg, 0, values=0, axis=0)
    first = (X.T@(sigmoid(X@theta)-y))/len(X)
    return first + reg

def one_vs_all(X, y, l=1, K = 10):
    n = X.shape[1]
    theta = np.zeros((K, n)) #创建与X的列数相同长度的0数组
    for i in range(1, K+1):
        theta_i = np.zeros(n, )

        res = opt.minimize(fun=computeCost,
                           x0=theta_i,
                           args=(X, y==i, l),
                           method='TNC',
                           jac=gradient)
        theta[i-1, :] = res.x

    return theta

def predict(X, theta):
    h = sigmoid(X@theta.T)
    h_argmax = np.argmax(h, axis=1)
    return h_argmax + 1


data = loadmat('ex3data1.mat')
raw_x = data['X']
raw_y = data['y']
X = np.insert(raw_x, 0, values=np.ones(raw_x.shape[0]), axis=1)
y = raw_y.flatten()
print(y.shape)
theta_all = one_vs_all(X, y, l=1, K=10)
print(theta_all)
y_pred = predict(X, theta_all)
acc = np.mean(y_pred == y)
print(acc)
print(classification_report(y, y_pred))

输出：

(5000,)
[[-2.38017165e+00  0.00000000e+00  0.00000000e+00 ...  1.30445260e-03
  -7.38340466e-10  0.00000000e+00]
 [-3.18105182e+00  0.00000000e+00  0.00000000e+00 ...  4.45068628e-03
  -5.07434671e-04  0.00000000e+00]
 [-4.79899590e+00  0.00000000e+00  0.00000000e+00 ... -2.86819678e-05
  -2.48325958e-07  0.00000000e+00]
 ...
 [-7.98439304e+00  0.00000000e+00  0.00000000e+00 ... -8.94750803e-05
   7.22839979e-06  0.00000000e+00]
 [-4.57041525e+00  0.00000000e+00  0.00000000e+00 ... -1.33611163e-03
   9.99192279e-05  0.00000000e+00]
 [-5.40239782e+00  0.00000000e+00  0.00000000e+00 ... -1.16450568e-04
   7.86669421e-06  0.00000000e+00]]
0.9446
              precision    recall  f1-score   support

           1       0.95      0.99      0.97       500
           2       0.95      0.92      0.93       500
           3       0.95      0.91      0.93       500
           4       0.95      0.95      0.95       500
           5       0.92      0.92      0.92       500
           6       0.97      0.98      0.97       500
           7       0.95      0.95      0.95       500
           8       0.93      0.92      0.92       500
           9       0.92      0.92      0.92       500
          10       0.97      0.99      0.98       500

    accuracy                           0.94      5000
   macro avg       0.94      0.94      0.94      5000
weighted avg       0.94      0.94      0.94      5000

用神经网络前向传播计算准确率代码：

from scipy.io import loadmat
import numpy as np
from sklearn.metrics import classification_report


def sigmoid(z):
    return 1 / (1 + np.exp(-z))

data = loadmat('ex3data1.mat')
raw_x = data['X']
raw_y = data['y']
X = np.insert(raw_x, 0, values=np.ones(raw_x.shape[0]), axis=1)
y = raw_y.flatten()
print(y.shape)
theta = loadmat('ex3weights.mat')
theta1 = theta['Theta1']
theta2 = theta['Theta2']

a1 = X
z2 = X@theta1.T
a2 = sigmoid(z2)
a2 = np.insert(a2, 0, values=1, axis=1)
z3 = a2@theta2.T
a3 = sigmoid(z3)
y_pred = np.argmax(a3, axis=1) + 1
acc = np.mean(y_pred == y)
print(acc)
print(classification_report(y, y_pred))

输出：

(5000,)
0.9752
              precision    recall  f1-score   support

           1       0.97      0.98      0.98       500
           2       0.98      0.97      0.98       500
           3       0.98      0.96      0.97       500
           4       0.97      0.97      0.97       500
           5       0.97      0.98      0.98       500
           6       0.98      0.99      0.98       500
           7       0.98      0.97      0.97       500
           8       0.98      0.98      0.98       500
           9       0.97      0.96      0.96       500
          10       0.98      0.99      0.99       500

    accuracy                           0.98      5000
   macro avg       0.98      0.98      0.98      5000
weighted avg       0.98      0.98      0.98      5000

总结：在构建多元分类的模型中，方法就是将其转化为二元分类，再做循环计算，这样每次只需要将本身看做为0或1即可，注意其每次循环时要取概率最高的那次才有意义。用神经网络时，其结果有点过于理想了，怀疑是出现了过拟合现象。

视频订正参考：【作业讲解】编程作业3：神经网络（上）_哔哩哔哩_bilibili

原文地址：https://blog.csdn.net/Chef_Chen/article/details/143534949

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：阿里云函数计算GBK编码
下一篇：【Ant.designpro】上传图片

oracle字符集的使用(修改字符集可能导致索引失效)
oracle字符集的使用(修改字符集可能导致索引失效)
阅读更多2024-11-08
学习threejs，使用JSON格式保存和加载整个场景
本文详细介绍如何基于threejs在三维场景中使用JSON格式保存和加载整个场景，亲测可用。希望能帮助到您。一起学习，加油！加油！
阅读更多2024-11-08
现代Web开发：GraphQL入门指南
GraphQL 是一种用于 API 的查询语言，它提供了一种标准的方式来请求和操作数据。GraphQL 由 Facebook 开发并于 2015 年开源，现已广泛应用于各种规模的项目中。`);`);}
阅读更多2024-11-08
flutter鸿蒙模拟器 Win环境调试报错问题记录（暂未解决）
我在华为论坛找到了带图的案例，主要聚焦在支付包插件的使用上，但我本来也没有使用该插件，加上了也运行不起来。解决效果：跑了一个flutter空工程，排除第三方插件干扰，依然报错，修改abiFilters
阅读更多2024-11-08
基于SSM（Spring + Spring MVC + MyBatis）框架的药房管理系统
用户管理：管理员可以添加、删除、修改和查询用户信息。药品管理：支持对药品信息的增删改查操作，包括药品名称、价格、库存量等。供应商管理：记录供应商信息，如名称、联系方式等。销售管理：处理销售订单，记录销
阅读更多2024-11-08
大数据中的Kafka， Zookeeper，Flume，Nginx， Sqoop与ETL
大数据中有用的重要概念
阅读更多2024-11-08
Python | Leetcode Python题解之第530题二叉搜索树的最小绝对差
Python | Leetcode Python题解之第530题二叉搜索树的最小绝对差
阅读更多2024-11-08
《Python OpenCV从菜鸟到高手》——零基础进阶，开启图像处理与计算机视觉的大门！
《Python OpenCV从菜鸟到高手》是一本深入探讨Python与OpenCV技术的图像处理教程。从Python的基础知识到OpenCV的强大功能，这本书带领读者逐步掌握计算机视觉的核心技术。Py
阅读更多2024-11-08
Python决策树、随机森林、朴素贝叶斯、KNN（K-最近邻居）分类分析银行拉新活动挖掘潜在贷款客户附数据代码
最近我们被客户要求撰写关于银行拉新活动的研究报告，包括一些图形和统计输出。项目背景：银行的主要盈利业务靠的是贷款，这些客户中的大多数是存款大小不等的责任客户（存款人）。银行拥有不断增长的客户该银行希望
阅读更多2024-11-08
[C++]使用cpphttplib的http服务上传和下载
cpphttplib的http服务上传下载代码
阅读更多2024-11-08

从0开始机器学习--Day16--神经网络作业

相关文章