机器学习.线性回归

🕗 发布于 2024-02-29 11:35 机器学习 线性回归 人工智能

斯塔1和2是权重项，斯塔0是偏置项，在训练过程中为了使得训练结果更加精确而做的微调，不是一个大范围的因素，核心影响因素是权重项

为了完成矩阵的运算，在斯塔0后面乘x0，使得满足矩阵的转换，所以在处理数据时候会添加如有上图所示的x0一列全是1的数据

为了得出这个平面，我们要做的就是找出所有的未知量斯塔

y为真实值，斯塔乘x是预测值，伊普西隆是误差值，每个样本的真实值和误差值都存在误差
什么是机器学习呢：就是你给机器一堆数据，机器通过数据不断学习，调整参数，最终得出完美符合数据特征的参数，机器学习==调参侠
我们要想求斯塔，就要将关于伊普西隆的算式转化成关于斯塔的算式

上图第三个算式左边的解释：x与斯塔组合后与y的数值越相近越好

所以p值越大越好

为什么是累乘？因为需要大量的数据去完善最后的参数，使得参数更加准确，因为乘法难解，所以可以加上对数转换成加法，而且转换后虽然L的数值改变了，但是我们要求取的是斯塔为何值使得L最大，所以不改变最后的斯塔数值

要让似然函数数值最大化，由于前面的项是一个常数项，所以后面的项就要最小化

这里的x和斯塔不是一个数，而是一个矩阵

经过求偏导，得出斯塔，但是机器学习是一个通过不断学习的过程不断完善斯塔这个参数，但是上面求解决斯塔的过程并没有一个学习的过程

做切线，走一小步，然后继续做切线，继续一小步，直到走到最低点

有一个问题：计算斯塔1和斯塔0的时候是一起计算好还是分别单独计算好呢？答案是分别计算，因为参数具有独立性

第二个问题：如何找到当前最合适的方向，求偏导

解释一下这张图上的目标函数为什么多了个平方：是因为将数据的误差效果放大

这个公式就是对目标函数求偏导得出方向，因为梯度下降是沿这原来的反方向走，所以后面那个公式前面的符号改变成＋号，表示在原来的初始位置斯塔j的位置走那么长的距离

由于批量梯度下降和随机梯度下降各有各的毛病，所以一般采用小批量梯度下降法，每次更新选择一小部分数据来算，比较实用

小批量梯度下降法公式中的α就是学习率，一般是0.01或者0.001

在写代码时，只需要完成上图花圈的部分就可以，m代表所有样本的个数，y代表真实值，h斯塔是预测值，xij也是样本中本来有的
import numpy as np


def prepare_for_training(data, polynomial_degree, sinusoid_degree, normalize_data):
    pass


class LinearRegression:#polynomial_degree,sinusoid_degree,normalize_data目前来说没有用，当成摆设，data是数据，label是真实值y
    def __init__(self,data,labels,polynomial_degree=0,sinusoid_degree=0,normalize_data=True):
        '''对数据进行预处理操作:data_processed表示处理后的数据，features_mean表示处理后数据的平均值，features_deviation表示处理后数据的方差'''
        (data_processed,
         features_mean,
         features_deviation)=prepare_for_training(data,polynomial_degree=0,sinusoid_degree=0,normalize_data=True)
        self.data=data_processed
        self.labels=labels
        self.features_mean=features_mean
        self.features_deviation=features_deviation
        self.polynomial_degree=polynomial_degree
        self.sinusoid_degree=sinusoid_degree
        self.normalize_data=normalize_data

        num_feature=self.data.shape[1]#得到data数据据中的列数，因为theta与data是一一对应的关系，故此将data中的列数取出来作为theta中的行数
        self.theta=np.zeros((num_feature,1))#初始化theta,num_feature行，1列的矩阵

    def train(self,alpha,num_iteration=500):#训练模型
        cost_history=self.gradient_descent(alpha,num_iteration)
        return self.theta,cost_history


    def gradient_descent(self,alpha,num_iteration):#梯度下降
        cost_history=[]#存储损失值
        for _ in range(num_iteration):
            self.gradient_step(alpha)
            cost_history.append(self.cost_function(self.data,self.labels))#添加损失值
        return cost_history

    def gradient_step(self,alpha):#公式实现&&参数的更新
            num_examples=self.data.shape[0]
            prediction=LinearRegression.hypothesis(self.data,self.theta)
            delta=prediction-self.labels
            theta=self.theta
            theta=theta-alpha*(1/num_examples)*(np.dot(delta.T,self.data)).T
            self.theta=theta

    def cost_function(self,data,labels):#损失函数，计算cost损失值
        num_examples=data.shape[0]
        delta=LinearRegression.hypothesis(self.data,self.theta)-labels
        cost=(1/2)*np.dot(delta.T,delta)/num_examples
        return cost[0][0]
    @staticmethod#计算预测值
    def hypothesis(data,theta):
            predictions=np.dot(data,theta)
            return predictions

    def get_cost(self,data,labels):
        data_processed=prepare_for_training(data,self.polynomial_degree,self.sinusoid_degree,self.normalize_data)[0]
        return self.cost_function(data_processed,labels)

    def predict(self,data):
        data_processed=prepare_for_training(data,self.polynomial_degree,self.sinusoid_degree,self.normalize_data)[0]
        predictions=LinearRegression.hypothesis(data_processed,self.theta)
        return predictions

原文地址：https://blog.csdn.net/2301_79724443/article/details/136283747

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：索引使用规则3——SQL提示
下一篇：Vue3 Hooks函数使用及封装思想

GOLANG笔记第四周
原本的本地函数放到另一个服务器上运行，但是引入了很多新问题Call 的id映射序列化和反序列化网络传输。
阅读更多2024-11-16
redis集群主备模式的快速搭建
redis主备集群可以有效的实现节点的冗余备份，提高redis的负载压力的同时，又有效的实现了故障切换。
阅读更多2024-11-16
Python实现贪吃蛇经典解压小游戏！附源码
大家应该都玩过诺基亚上面的贪吃蛇吧，那是一段美好的童年回忆，本文将带你一步步用python语言实现一个snake小游戏！版本：Python3●系统：Windows●相关模块：pygamepip ins
阅读更多2024-11-16
Unity中HDRP设置抗锯齿
在Unity的高清渲染管线（HDRP）中，Post Anti-Aliasing（后期抗锯齿）提供了几种不同的抗锯齿选项，以减少图像中的锯齿效果并提升视觉质量。FXAA是一种基于像素的抗锯齿方法，通过模
阅读更多2024-11-16
嘎嘎快充php版服务端部署配置注意玉阳软件
6、需要移除PHP禁用函数：proc_open、pcntl_alarm、pcntl_fork、pcntl_wait、pcntl_signal、pcntl_signal_dispatch。7、不需要cd
阅读更多2024-11-16
Docker 容器常见故障排查及处理
Docker 容器常见故障排查及处理。
阅读更多2024-11-16
Python实现人脸识别算法并封装为类库（续）
本文将介绍如何使用Python实现一个人脸识别系统，并将其封装为一个类库。我们将逐步扩展和完善这个类库，增加代码优化、人脸照片存储到数据库、对特殊场景（如戴口罩、眼镜）的优化，以及灵活的识别距离设置。
阅读更多2024-11-16
CentOS虚拟机使用记录
1.安装 Vmtool ,重启后可显示U盘2.安装minicomcentOs 安装使用yum minicom ,没有apt-get 命令通过ssh网口root 2440ssh root@192.16
阅读更多2024-11-16
MATLAB中的绘图技巧
综上所述，MATLAB凭借其强大的绘图功能，为用户提供了丰富多样的可视化选择。从基础的二维图形到复杂的三维动画，MATLAB都能够胜任。掌握这些绘图技巧，不仅能够提升数据分析的可读性，也能够增强报告和
阅读更多2024-11-16
Win11 终端执行 python xxx.py 没反应
在 Win11 上写了一段 Python 代码来分析日志文件，发现执行没反应。是在 VSCode 里的终端中执行的。, 是 PowerShell；也尝试了 cmd，情况一样。WindowsApps
阅读更多2024-11-16

机器学习.线性回归

相关文章