梯度提升决策树（Gradient Boosting Decision Trees，GBDT）

🕗 发布于 2024-01-16 11:40 决策树 boosting 算法梯度提升 机器学习

梯度提升决策树（Gradient Boosting Decision Trees，GBDT）

提升树是以分类树或回归树为基本分类器的提升方法。提升树被认为是统计学习中性能最好的方法之一。

提升方法实际采用加法模型(即基函数的线性组合)与前向分步算法。以决策树为基函数的提升方法称为提升树（boosting tree）。对分类问题决策树是二叉分类树，对回归问题决策树是二叉回归树。

---------------------------------------------------------------------------------------------------------------------------------------

输入：线性可分训练数据集 $T= \{(x_1,y_1), (x_2,y_2),…, (x_N,y_N)\}$

其中， $x_i∈X=R^n,y_i∈Y, i = 1,2,…,N$ ；弱学习算法

输出：提升树 $f_M(x)$

优化问题：

不同问题的提升树学习算法，其主要区别在于使用的损失函数不同。回归问题：平方误差损失函数；分类问题：指数损失函数。

$f_{m-1}(x)$ 为当前模型，通过经验风险极小化确定下一颗决策树的参数 $\Theta_m$ ：
$\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^NL(y_i,f_m(x))\\ \\ →\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^NL(y_i,f_{m-1}(x_i)+T(x;\Theta_m))$
回归问题：
$\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^N(y_i-f_{m}(x))^2\\ \\ →\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^N(y_i-f_{m-1}(x)-T(x;\Theta_m))^2\\ \\ →\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^N(r-T(x;\Theta_m))^2,r=y-f_{m-1}(x)$

分类问题：
$\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^Nexp(-y_if_m(x))\\ \\ →\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^Nexp[-y_i(f_{m-1}(x)+T(x;\Theta_m))]$
---------------------------------------------------------------------------------------------------------------------------------------

提升树模型可以表示为决策树的加法模型：
$f_M(x)=\sum_{m=1}^MT(x;\Theta_m)$
其中， $T(x;\Theta_m)$ 表示决策树， $\Theta_m$ 为决策树的参数，M为树的个数。

首先确定初始提升树 $f_0(x)=0$ ，第m步的模型是：
$f_{m}(x)=f_{m-1}(x)+T(x;\Theta_m)$

回归问题的提升树

已知一个训练数据集 $T= \{(x_1,y_1), (x_2,y_2),…, (x_N,y_N)\}$ 其中， $x_i∈X=R^n,y_i∈Y, i = 1,2,…,N$ ；X 为输入空间，Y 为输出空间。

如果将输入空间划分为J 个互不相交的区域 $R_1,R_2,...,R_J$ ，并且在每个区域上确定输出的常量 $c_j$ ，那么树可以表示为：
$T(x;\Theta)=\sum_{j=1}^Jc_jI(x∈R_j)$
其中，参数 $\Theta=\{(R_1,c_1),(R_2,c_2),...,(R_J,c_J)\}$ 表示树的区域划分和各个区域上的常数。J 是回归树的复杂度即叶节点个数。

回归问题的前向分布算法

$f_0(x)=0\\ \\ f_m(x)=f_{m-1}(x)+T(x;\Theta_m),\ \ \ m=1,2,...,M\\ \\ f_M(x)=\sum_{m=1}^MT(x;\Theta_m)$

第m步时，当前模型是 $f_{m-1}(x)$ ，要求解以下的式子（回归问题采用均方误差损失函数）得到 $\hat\Theta_m$ ：
$\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^N(y_i-f_{m}(x))^2\\ \\ →\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^N(y_i-f_{m-1}(x)-T(x;\Theta_m))^2\\ \\ →\hat\Theta_m=arg\ \underset{\Theta_m}{min}\sum_{i=1}^N(r-T(x;\Theta_m))^2,r=y-f_{m-1}(x)$
算法流程：

输入：线性可分训练数据集 $T= \{(x_1,y_1), (x_2,y_2),…, (x_N,y_N)\}$

其中， $x_i∈X=R^n,y_i∈Y, i = 1,2,…,N$ ；弱学习算法

输出：提升树 $f_M(x)$

（1）初始化 $f_0(x)= 0$ 。

（2）对m=1，2，…，M。

（a）按照 $T(x;\Theta)=\sum_{j=1}^Jc_jI(x∈R_j)$ 计算残差：
$r_{mi}=y_i-f_{m-1}(x_i),\ \ \ i=1,2,...,N$
（b）拟合残差 $r_{mi}$ 学习一个回归树，得到 $T(x;\Theta_m )$

（c）更新 $f_m(x)=f_{m-1}(x)+T(x;\Theta_m)$

（3）得到回归问题的提升树
$f_M(x)=\sum_{m=1}^MT(x;\Theta_m)$

梯度提升

提升树算法利用加法模型与前向分布算法实现学习的优化过程。当损失函数时平方损失和指数损失函数的时候，每一步的优化时很简单的。但是对于一般损失函数而言，往往每一步优化都不是容易的。

其关键是利用损失函数的负梯度在当前模型的值
$-[\frac{\partial L(y,f(x_i))}{\partial f(x_i)}]_{f(x)=f_{m-1}(x)}$
作为回归问题提升树算法中的残差的近似值，拟合一个回归树。

算法流程：

输入：线性可分训练数据集 $T= \{(x_1,y_1), (x_2,y_2),…, (x_N,y_N)\}$

其中， $x_i∈X=R^n,y_i∈Y, i = 1,2,…,N$ ；损失函数 $L (y, f (x))$ ;

输出：提升树 $\hat f(x)$

（1）初始化 $f_0(x)= arg \underset{c}{min}\sum_{i=1}^NL(y_i,c)$ 。

（2）对m=1，2，…，M。

（a）对i=1，2，…，N，计算：
$r_{mi}=-[\frac{\partial L(y,f(x_i))}{\partial f(x_i)}]_{f(x)=f_{m-1}(x)}$
（b）拟合残差 $r_{mi}$ 学习一个回归树，得到第m颗树的叶节点区域 $R_{mj},j=1,2,...,J$

（c）对j=1，2，…，J，计算
$c_{mj}=arg\ \underset{c}{min}\sum_{x_i∈R_{mj}}L(y_i,f_{m-1}(x_i)+c)$
（d）更新 $f_m(x)=f_{m-1}(x)+\sum_{j=1}^Jc_{mj}I(x∈R_{mj})$

（3）得到回归树
$\hat f(x)=f_M(x)=\sum_{m=1}^M\sum_{j=1}^Jc_{mj}I(x∈R_{mj})$

原文地址：https://blog.csdn.net/Gaowang_1/article/details/135479070

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Framework定制-在JAVA核心库中移植Android Log
下一篇：QCA9882: The powerful engine of wireless LAN

【C++】构造与析构函数
⽆参构造函数、全缺省构造函数、我们不写构造时编译器默认⽣成的构造函数，都叫做默认构造函数。
阅读更多2024-11-18
#渗透测试#SRC漏洞挖掘#蓝队基础之网络七层杀伤链02
识别Windows典型应用是指通过一定的技术和方法，自动识别和分类Windows操作系统中的各种应用程序。这对于自动化测试、应用管理、性能监控等领域具有重要意义。识别Linux典型应用是指通过一定的技
阅读更多2024-11-18
【网络】什么是交换机？switch
综上所述，交换机是一种重要的网络设备，它通过为网络节点提供独享通路和高效的数据转发机制，提高了网络传输效率和管理便利性。它通过对MAC地址的识别，实现数据帧的转发。功能：交换机能为接入交换机的任意两个
阅读更多2024-11-18
Go开发指南- Goroutine
在java中我们要实现并发编程的时候，通常要自己维护一个线程池，并且需要去包装任务、调度任务和维护上下文切换。这个过程需要消耗大量的精力。Go语言中有一种机制，可以让系统自动把任务分配到CPU上实现并
阅读更多2024-11-18
NX二次开发将刀轨转曲线
获取选择的程序导轨和当前加工坐标系，获取导轨数据点转换到加工坐标系，然后创建样条，创建样条是用UG录制的代码，有更好的方法欢迎交流学习一下。
阅读更多2024-11-18
STM32寄存器结构体详解
2.#define IOMUXC_GPIO1_IO03_GPIO1_IO03 0x020E0068U, 0x5U, 0x00000000U, 0x0U, 0x020E02F4U 的解释。通过宏定义，使
阅读更多2024-11-18
Android 12.0 第三方app授予DeviceOwner权限调用系统reboot,显示隐藏app,锁屏,禁用app等功能系统层部分实现
在12.0的系统rom定制化开发中，在有些客户开发app的功能中，需要系统授予app的DeviceOwner权限，然后app就可以实现重启关机禁用下拉通知栏，显示隐藏app，等功能，首选需要在app和
阅读更多2024-11-18
同构字符串
每个出现的字符都应当映射到另一个字符，同时不改变字符的顺序。不同字符不能映射到同一个字符上，相同字符只能映射到同一个字符上，字符可以映射到自己本身。中的字符可以按某种映射关系替换得到。，那么这两个字符
阅读更多2024-11-18
unity 下拉列表根据内容长度进行下拉列表长度的自适应
unity 下拉列表根据内容长度进行下拉列表长度的自适应
阅读更多2024-11-18
MATLAB实现狼群算法优化柔性车间调度(GWO-fjsp)
MATLAB实现狼群算法优化柔性车间调度(GWO-fjsp)
阅读更多2024-11-18

梯度提升决策树（Gradient Boosting Decision Trees，GBDT）