【逻辑回归+实战】

🕗 发布于 2024-09-24 08:17 逻辑回归算法 机器学习

原文：https://blog.csdn.net/didiaopao/article/details/126483343

回归和分类区别

回归：
举个例子，输入一个人每日的运动时间、睡眠时间、工作时间、饮食等一些特征来预测一个人的体重，一个人的体重的值可以有无限个值。所以预测的结果是无限的、不确定的连续数值。这样的机器学习任务就是回归任务，如线性回归我们用平方差损失函数。
分类：
如果利用一个人每日的运动时间、睡眠时间、工作时间、饮食等一些特征来判断这个人的身体状况是否健康，那么最终的判断的结果就只有两种健康和不健康。这样的输出结果为离散值，预测的结果也是一个有限的数值来代表种类，如逻辑回归分类我们用交叉熵损失函数。

逻辑回归

虽然有回归，但他是来做二分类的任务，逻辑回归模型通过一个线性组合
$y=x_0w_0+x_1w_1+x_2w_2+···+x_nw_n+b$
即 $y=W^TX+b$
其中x为样本某一特征取值， wT及b为输入参数。
上式输出的值是可以小于0或者大于1的。但我们希望逻辑回归输出一个0到1的数。可以借助Sigmoid函数来将输出映射到0到1：
先来学习下sigmoid函数
$g(y)=\frac{1}{1+e^{-y}}$

即当z趋近于负无穷时值 $g (z)$ 无限趋近于0，当z趋近于正无穷时值 $g (z)$ 无限趋近于1，也就是说它可以将自变量约束到0和1间

模型公式推导

因此，逻辑回归模型可以用如下的公式来表达：
$g(y)=\frac{1}{1+e^{-W^TX+b}}$

因此对于一个二分类的的问题，此时正例和反例的函数表达式就如下式所示：
预测结果为正例的表达式：
$=\frac{1}{1+e^{-W^TX+b}}$
可以理解为模型预测结果 y为1的概率，例如我们通过这个模型预测完的y=0.95，也就是说预测结果 y为1的概率为95%，那么预测为0的概率呢，当然是100%-95%，即如下
预测结果为反例的表达式：
$=\frac{e^{-W^TX+b}}{1+e^{-W^TX+b}}=1-p(y = 1|X)$

在函数的计算推导过程中，如果分别考虑正反两例情况，计算起来就特别麻烦，
因此可以将上述两个例子合并起来得到如下公式：
故模型公式为
$p(y|X)=p(y|X)^y[1-p(y |X)] ^{1-y}$
也就是当y为0时是后项，为1时为前项

损失函数

小写希腊字母： $\alpha, \beta, \gamma, \delta, \epsilon, \zeta, \eta, \theta, \iota, \kappa, \lambda, \mu, \nu, \xi, \pi, \rho, \sigma, \tau, \upsilon, \phi, \chi, \psi, \omega$
大写希腊字母： $\Gamma, \Delta, \Theta, \Lambda, \Xi, \Pi, \Sigma, \Upsilon, \Phi, \Psi, \Omega$
上面引入的sigmoid函数仅仅起分类0到1的作用，z函数是预测的模型函数，那么损失函数是什么呢

前面的逻辑回归模型也有了，利用该模型可以对输入的数据特征进行分类判断。但是模型的
判断能力的好坏取决于模型中的参数𝑤和𝑏，因此我们需要从提供的数据样本中不断学习，从
而更新参数𝑤和𝑏使得预测出的结果全部正确的概率最大，简单来讲就是所有的样本的预测正
确的概率相乘得到数值是最大的，按这样的要求得到数据表达式如下所示，该式就是逻辑回归
的损失函数。

$=\prod_{i=1}^{m} p(1|X)^{y_i}(1-p(1 |X))^{1-{y_i}}$
这里我的理解是当在数据集中某个样本 $X_1$ 的y为1，通过模型预测出来的结果为0.8（即为1的概率为80%），某个样本 $X_2$ 的y为1，通过模型预测出来的结果为0.85（即为1的概率为85%），某个样本 $X_3$ 的y为0，通过模型预测出来的结果为0.9（即为0的概率为90%），我们把每个预测出来的结果求积，要让积最大，也就是为正确的概率最大

$=\prod_{i=1}^{m} (\sigma(W^Tx_i+b))^{y_i}(1-\sigma(W^Tx_i+b))^{1-{y_i}}$
相对连乘运算，连加运算计算起来要比连乘要简单许多，因此可以利用两边同时取log的形式让连乘变成连加。此时就变成如下式所示：
$b)=\log L(w,b)$
$=\sum_{i=1}^{m} \left[ y_i \log \sigma(W^Tx_i+b)+ (1 - y_i) \log (1 - \sigma(W^Tx_i+b)) \right]$
此时我们只需要找到一组参数𝑤和𝑏使得𝑙 𝑤, 𝑏 最大即可，但是在机器学习中通常希望把上升问题转化为下降问题，因此将该函数取相反数即可。得到下式：
$J(w,b)=-\frac{1}{m}l(w, b)$
除以m是取平均，J (w,b)这个函数就是逻辑回归最终的损失函数
两个知识点：
①sigmoid的导数如： $g^{'} (z) = g (z) (1 - g (z))$

②： $log'x=\frac{1}{x}$

梯度下降

此时，只要利用梯度下降法进行参数更新就能通过数据样本不断学习更新参数了，梯度下降法的步骤如下：
步骤1，利用损失函数求解对应参数的偏导数：
w参数的偏导数的计算步骤如下所示：

①：参数w的更新
$\frac{\partial J(w,b)}{\partial w}=\frac{1}{m}\sum_{i=1}^{m} (\sigma(w^Tx_i+b)-y_i)x_i$
②：参数b的更新
$\frac{\partial J(w,b)}{\partial b}=\frac{1}{m}\sum_{i=1}^{m} \sigma(w^Tx_i+b)-y_i$

所以
$w=w-\frac{\partial J(w,b)}{\partial w}$
$b=b-\frac{\partial J(w,b)}{\partial b}$

代码

import numpy as np
import pandas as pd

# 不像上一章需要我们手打算法，这里直接用sklearn定义好的算法

# 导入数据集划分的，就是划分训练集，测试集和验证集
from sklearn.model_selection import train_test_split

# 导入数据集预处理的MinMaxScaler，它主要用于将特征缩放到给定的最小值和最大值之间，通常是 0 和 1，
# 但也可以是其他范围。这种缩放方法对于许多机器学习算法来说是非常有用的，
# 特别是那些基于距离的算法（如 K-近邻、K-均值聚类等）和需要梯度下降优化的算法（如神经网络）。
# 说白了就是归一化，因为不管是机器学习模型还是深度学习模型总是认为数值量级越大越重要
# 同时归一化后主要由每个特征的w决定权重，并且训练速度也大大加快了
from sklearn.preprocessing import MinMaxScaler

# 导入逻辑回归模型
from sklearn.linear_model import LogisticRegression

# 导入模型评估的函数，如精确率，F1，召回率等等
from sklearn.metrics import classification_report
##############################数据预处理###################################
# 读取数据
dataset = pd.read_csv("breast_cancer_data.csv")
# ctrl+?快速注释
# print(dataset)

# 提取特征x
X = dataset.iloc[:, :-1]  # 选择除了最后一列之外的所有列
# print(X)

# 提取标签y
Y = dataset["target"]  # 选择除了最后一列之外的所有列
# print(Y)

# 划分训练集和测试集
x_train,x_test,y_train,y_test = train_test_split(X,Y,test_size=0.2)

# 进行数据的归一化
sc = MinMaxScaler(feature_range=(0,1))
x_train = sc.fit_transform(x_train)
x_test = sc.fit_transform(x_test)

##############################################逻辑回归模型搭建####################################################
lr = LogisticRegression()
lr.fit(x_train,y_train)

# 打印模型的参数
# print("w=", lr.coef_)
# print("b=", lr.intercept_)

# 利用训练好的模型进行推理
pre_reslut = lr.predict(x_test)
# print(pre_reslut)

# 打印预测结果的概率
pre_reslut_proba = lr.predict_proba(x_test)
# print(pre_reslut_proba)

# 获取恶性肿瘤的概率
pre_list = pre_reslut_proba[:,1]
# print(pre_list)

# 设置阈值，大于 30%的认为是恶心肿瘤
thresholds = 0.3

# 设置保存结果的列表
reslut = []
reslut_name = []

for i in range(len(pre_list)):
    if pre_list[i] > thresholds:
        reslut.append(1)
        reslut_name.append("恶性肿瘤")
    else:
        reslut.append(0)
        reslut_name.append("良性肿瘤")

# print(reslut)
# print(reslut_name)

##############################################模型预测结果评估####################################################
# 输出结果的精确率，召回率，F1
report = classification_report(y_test,reslut,labels = [0,1],target_names=["良性肿瘤","恶性肿瘤"])
print(report)

原文地址：https://blog.csdn.net/qq_43094272/article/details/142385051

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Spring Boot 学习之路 -- 处理 HTTP 请求
下一篇：Python3爬虫教程-HTTP基本原理

【python笔记02】面向对象思想
面向对象的核心思想是：不仅仅是简单的将功能进行封装（封装成函数），更是对调用该功能的主体进行封装，实现某个主体拥有多个功能，在使用的过程中，先得到对应的主体，再使用主体去实现相关的功能！计算机语言的语
阅读更多2024-11-18
《Django 5 By Example》阅读笔记：p211-p236
adv. without any interruption(连续地).
阅读更多2024-11-18
【Android】IPC机制—Serializable、Parcelable、Binder用法
Serializable是Java所提供的一个序列化接口，它是一个空接口，为对象提供标准的序列化和反序列化操作。serialVersionUID也并不是必须的，不声明serialVersionUID也
阅读更多2024-11-18
大麦抢票科技
大麦演唱会
阅读更多2024-11-18
力扣（leetcode）面试经典150题——27. 移除元素
给你一个数组nums和一个值val，你需要移除所有数值等于val的元素。元素的顺序可能发生改变。然后返回nums中与val不同的元素的数量。假设nums中不等于val的元素数量为knumsnumskv
阅读更多2024-11-18
Mongo-BI（bi-connector）配置
补充 mongosql 加到开启自启动。官网提供的配置说明-太复杂。其他人的配置-简单清晰。
阅读更多2024-11-18
【C#】C#编程基础：探索控制台应用与数据操作
本文旨在为C#语言的初学者提供一个全面的入门指南，涵盖了控制台项目的基本使用、数据类型的转换、字符串与数组的操作、引用类型与值类型的区别、常量与枚举的使用等多个方面。通过详细的代码示例和解释，读者可以
阅读更多2024-11-18
1116蓝桥杯算法双周赛小白入门赛4.5.6题题解
除了自己以外,给每个人带一块钱 ========> 自己少一块钱 ========>nums[pos]--本人是很普通的大学生,算法水平并不高,不能保证解答一定
阅读更多2024-11-18
Scala-注释、标识符、变量与常量-用法详解
Scala初步
阅读更多2024-11-18
信捷 XDH PLC C语言 Ethercat 简易绝对运动 BMC_A_DRVA_BODY函数
/全局变量给定时器的线圈通电。（1）DRVA_PAR_array是类型为BMC_A_DRVA，长度为3的数组。（3）T_MoveOK_array是类型为BMC_A_Stop，长度为3的数组。（2）st
阅读更多2024-11-18