自学内容网 自学内容网

机器学习中的优化算法

Optimization Algorithms in Machine Learning,机器学习中的优化算法。

优化算法是机器学习模型的支柱,因为它们使建模过程能够从给定的数据集中学习。这些算法用于查找目标函数的最小值或最大值,该函数在机器学习上下文中代表误差或损失。在本文中,讨论了不同的优化方法以及它们在机器学习中的用途及其意义。

目录

  • 了解机器学习中的优化
  • 机器学习中的优化算法类型
    • 1. 一阶算法
    • 2. 二阶算法
  • 针对特定机器学习任务的优化
    • 1. 分类任务:Logistic 回归优化
    • 2. 回归任务:线性回归优化
  • 优化算法的挑战和局限性

机器学习中的优化

优化是从各种可用的可行解决方案中选择最佳解决方案的过程。换句话说,优化可以定义为获得给定函数的最佳值或最小值的一种方式。在大多数问题中,目标函数 f(x) 是受约束的,目的是确定最小化或最大化 f(x) 的 ?x 值。

关键概念:

  • 目标函数:必须优化的目标或函数是利润函数。
  • 变量:以下是必须调整的参数:
  • Constraints解决方案要满足的约束。
  • Feasible Region(可行区域):在给定约束的情况下可行的所有潜在解决方案的子集。

机器学习中的优化算法类型

有各种类型的优化算法,每种算法都有其优点和缺点。 这些算法大致可分为两类:一阶算法和二阶算法

 一阶算法

  • 梯度下降
  • 随机优化技术
  • 进化算法
  • 元启发式优化
  • Swarm 智能算法
  • 超参数优化
  • 深度学习中的优化

梯度下降及其变体

Gradient Descent 是一种基本的优化算法,用于通过迭代向最小值移动来最小化目标函数。它是一种一阶迭代算法,用于查找可微分多元函数的局部最小值。该算法的工作原理是在当前点的函数梯度 (或近似梯度) 的相反方向上采取重复步骤,因为这是最陡下降的方向。

假设我们想要最小化函数 f(x)=x2使用 Gradient Descent。

python

import numpy as np

# Define the gradient function for f(x) = x^2

def gradient(x):

    return 2 * x

# Gradient descent optimization function

def gradient_descent(gradient, start, learn_rate, n_iter=50, tolerance=1e-06):

    vector = start

    for _ in range(n_iter):

        diff = -learn_rate * gradient(vector)

        if np.all(np.abs(diff) <= tolerance):

            break

        vector += diff

    return vector

# Initial point

start = 5.0

# Learning rate

learn_rate = 0.1

# Number of iterations

n_iter = 50

# Tolerance for convergence

tolerance = 1e-6

# Gradient descent optimization

result = gradient_descent(gradient, start, learn_rate, n_iter, tolerance)

print(result)

输出

7.136238463529802e-05

梯度下降的变体:

  • 随机梯度下降 SGD):此变体建议一次使用单个训练示例更新模型,不需要大量计算,因此适用于大型数据集。因此,它们是随机的,可能会产生嘈杂的更新,因此可能需要仔细选择学习率。
  • Mini-Batch Gradient Descent此方法的设计方式是为每个小批量数据计算它,在时间和精度之间取得平衡。它的收敛速度比 SGD 快,在实践中广泛用于训练许多深度学习模型。
  • MomentumMomentum 通过将算法的前面步骤的信息添加到下一步来改进 SGD。通过将当前更新向量的一部分添加到之前的更新中,它使算法能够穿透平坦区域和嘈杂的梯度,从而有助于最大限度地减少训练和查找收敛的时间。

随机优化技术

随机优化技术将随机性引入搜索过程,这对于解决传统方法可能难以解决的复杂非凸优化问题可能有利。

  • 模拟退火:受冶金学退火过程的启发,该技术从高温(高随机性)开始,允许广泛探索搜索空间。随着时间的推移,温度降低(随机性降低),模仿金属的冷却,这有助于算法收敛到更好的解决方案,同时避免局部最小值。
  • 随机搜索:这种简单的方法在搜索空间中随机选择点,然后对它们进行评估。尽管它可能看起来很幼稚,但随机搜索实际上非常有效,特别是对于高维或知之甚少的优化环境。这种方法易于实现,而且能够作为更复杂算法的基准,因此很有吸引力。此外,随机搜索也可能成为使用其他优化方法的更广泛策略的一部分。

使用随机优化算法时,必须考虑以下实际方面:

  • 重复评估:随机优化算法通常需要对目标函数进行重复评估,这可能非常耗时。因此,平衡评估数量与可用计算资源至关重要。
  • 问题结构:随机优化算法的选择取决于问题的结构。例如,模拟退火适用于具有多个局部最优值的问题,而随机搜索对高维优化景观有效。

 进化算法

进化算法受到自然选择的启发,包括遗传算法和差分进化等技术。它们通常用于解决使用传统方法难以或无法解决的复杂优化问题。

关键组件

  • 总体:优化问题的一组候选解决方案。
  • Fitness Function:评估每个候选解决方案质量的函数。
  • 选择:一种用于选择要复制的最适候选者的机制。
  • Genetic Operators:修改所选候选者以创建新的后代的运算符,例如交叉和突变。
  • 终止:停止算法的条件,例如达到最大代数或令人满意的适应度。
 遗传算法

这些算法使用 crossover 和 mutation 运算符来进化种群。通常用于通过依赖生物启发的运算符(如 mutation、crossover 和 selection)为优化和搜索问题生成高质量的解决方案。

code

import numpy as np

# Define the fitness function (negative of the objective function)

def fitness_func(individual):

    return -np.sum(individual**2)

# Generate an initial population

def generate_population(size, dim):

    return np.random.rand(size, dim)

# Genetic algorithm

def genetic_algorithm(population, fitness_func, n_generations=100, mutation_rate=0.01):

    for _ in range(n_generations):

        population = sorted(population, key=fitness_func, reverse=True)

        next_generation = population[:len(population)//2].copy()

        while len(next_generation) < len(population):

            parents_indices = np.random.choice(len(next_generation), 2, replace=False)

          


原文地址:https://blog.csdn.net/jianqimingtian/article/details/142997275

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!