Python 机器学习求解 PDE 学习项目基础知识（2）TensorFlow 优化器使用

🕗 发布于 2024-07-24 07:12 python 机器学习 学习 tensorflow

TensorFlow 优化器以及会话使用指南

在我的系列专栏：深度学习求解PDE 的多数文章中将用到TensoFlow 优化器及其计算图学习框架，那么本篇文章就将解释如何在 TensorFlow 中使用 Adam 和 L-BFGS-B 优化器进行优化，并介绍了 TensorFlow 会话的框架。

优化器简介

在这里插入图片描述

Adam 优化器

Adam 优化器是深度学习中常用的一种优化算法，结合了动量法和 RMSProp 的优点。
案例：使用tf.train.AdamOptimizer 优化线性模型
假设我们有一个简单的线性模型 y=wx+b，其中 w 是权重，b 是偏置，我们希望通过训练来找到最优的 w 和 b，使得模型能够较好地拟合一组给定的数据点。读者可以从这个简单的案例学会此优化器使用方法.

#test1
# 步骤 1: 导入必要的库
import tensorflow as tf  
import numpy as np
# 步骤 2: 创建数据
#为了简单起见，我们手动创建一些线性数据并添加一些噪声。
# 生成数据  
np.random.seed(0)  
x_data = np.linspace(-1, 1, 100)[:, np.newaxis]  # 100个数据点，形状为[100, 1]  
noise = np.random.randn(*x_data.shape) * 0.1  # 添加噪声  
y_data = 2 * x_data + 1 + noise  # 真实模型为 y = 2x + 1
#步骤 3: 定义模型
# TensorFlow 1.x 风格  
x = tf.placeholder(tf.float32, shape=[None, 1])  
y = tf.placeholder(tf.float32, shape=[None, 1])  
  
# 定义模型参数  
W = tf.Variable(tf.random_normal([1, 1]), name='weight')  
b = tf.Variable(tf.zeros([1]), name='bias')  
  
# 定义模型  
y_pred = tf.matmul(x, W) + b

#步骤 4: 定义损失函数和优化器
# 定义损失函数  
loss = tf.reduce_mean(tf.square(y_pred - y))  # MSE损失  
  
# 定义优化器  
optimizer = tf.train.AdamOptimizer(learning_rate=0.01)  
train = optimizer.minimize(loss)

#步骤 5: 训练模型
# 初始化变量  
init = tf.global_variables_initializer()  
  
# 启动会话  
with tf.Session() as sess:  
    sess.run(init)  
      
    # 训练模型  
    for epoch in range(1000):  
        sess.run(train, feed_dict={x: x_data, y: y_data})  
          
        if epoch % 100 == 0:  
            print(f'Epoch {epoch}, Loss: {loss.eval(feed_dict={x: x_data, y: y_data})}')  
      
    # 获取训练后的参数  
    w_value, b_value = sess.run([W, b])  
    print(f'Trained w: {w_value}, b: {b_value}')

运行结果：
在这里插入图片描述
可见拟合效果还是不错的！

注意：从TensorFlow 2.x开始，推荐使用tf.keras.optimizers.Adam而不是tf.train.AdamOptimizer，因为TensorFlow 2.x更强调使用Keras API。

L-BFGS-B

L-BFGS-B 是一种基于准牛顿法的优化算法，适用于大规模无约束或有边界约束的优化问题。
下面这个简单的案例教你使用此优化器：

#test2 
import tensorflow as tf  
import numpy as np  
  
# 定义TensorFlow图  
with tf.Graph().as_default():  
    # 定义变量  
    x = tf.Variable(0.0, name='x')  
  
    # 定义损失函数  
    loss = (x - 3.0) ** 2  + 2
  
    # 初始化变量  
    init = tf.global_variables_initializer()  
  
    # 创建ScipyOptimizerInterface  
    train_lbfgs = tf.contrib.opt.ScipyOptimizerInterface(  
        loss,  
        var_list=[x],  
        method="L-BFGS-B",  
        options={'maxiter': 10000, 'ftol': 1.0 * np.finfo(float).eps}  
    )  
  
    # 启动会话  
    with tf.Session() as sess:  
        sess.run(init)  
          
        # 运行优化  
        train_lbfgs.minimize(sess)  
          
        # 获取优化后的变量值  
        optimized_x = x.eval(sess)  
        print("Optimized x:", optimized_x)

运行结果：

INFO:tensorflow:Optimization terminated with:
  Message: CONVERGENCE: NORM_OF_PROJECTED_GRADIENT_<=_PGTOL
  Objective function value: 2.000000
  Number of iterations: 2
  Number of functions evaluations: 3
Optimized x: 3.0

快狠准！

请注意，由于tf.contrib在TensorFlow 2.x中不再可用，如果你正在使用TensorFlow 2.x，并且需要类似的功能，可能需要考虑使用TensorFlow的tf.keras.optimizers中的优化器，这些优化器虽然不包括L-BFGS-B，但提供了许多其他有效的优化算法。

会话（Session）

在 TensorFlow 中，会话 (Session) 是运行计算图的环境。它负责分配资源（如变量）并执行操作。下面笔者给个例子，帮助读者理解使用 session 在 TF学习框架中的作用：

import tensorflow as tf
import numpy as np

# 定义占位符和变量
x = tf.placeholder(tf.float32, shape=[None, 1])
y = tf.placeholder(tf.float32, shape=[None, 1])

# 构建神经网络
layer = tf.layers.dense(x, 10, activation=tf.nn.relu)
output = tf.layers.dense(layer, 1)

# 定义损失函数
loss = tf.reduce_mean(tf.square(output - y))

# 定义优化器
train_adam = tf.train.AdamOptimizer(0.0008).minimize(loss)
train_lbfgs = tf.contrib.opt.ScipyOptimizerInterface(
    loss,
    method="L-BFGS-B",
    options={'maxiter': 10000, 'ftol': 1.0 * np.finfo(float).eps}
)

# 初始化变量
init = tf.global_variables_initializer()

# 创建会话并运行
with tf.Session() as sess:
    sess.run(init)
    
    # 使用 Adam 优化器进行训练
    for _ in range(1000):
        sess.run(train_adam, feed_dict={x: np.random.rand(10, 1), y: np.random.rand(10, 1)})
    
    # 使用 L-BFGS-B 优化器进行训练
    train_lbfgs.minimize(sess, feed_dict={x: np.random.rand(10, 1), y: np.random.rand(10, 1)})

    # 打印损失值
    print("Final loss:", sess.run(loss, feed_dict={x: np.random.rand(10, 1), y: np.random.rand(10, 1)}))

运行结果：

INFO:tensorflow:Optimization terminated with:
  Message: CONVERGENCE: NORM_OF_PROJECTED_GRADIENT_<=_PGTOL
  Objective function value: 0.080921
  Number of iterations: 7
  Number of functions evaluations: 10
Final loss: 0.048916824

Session确保了TensorFlow计算图的正确执行，是获取正确计算结果的关键步骤。没有Session，计算图只是定义在前端系统中的静态结构，无法转化为实际的计算任务。
优化资源利用：
通过Session的资源分配和管理功能，TensorFlow能够更高效地利用硬件资源，提高计算效率。这对于大规模的计算任务尤为重要。
支持复杂计算任务：
在处理复杂的计算任务时，如深度学习模型的训练，Session提供了必要的控制手段，使得用户能够更精细地管理计算过程，包括指定计算设备、控制资源使用等。

今天的基础知识就讲到这里！请持续关注~

原文地址：https://blog.csdn.net/qq_39538718/article/details/140646776

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Dav_笔记10：Using SQL Plan Management之3
下一篇：前端（1）HTML

配置cobbler服务提供centos7安装源
由RedHat公司基于python语言开发，作用：快速批量部署Linux系统。
阅读更多2024-09-17
【MySQL学习】基础指令全解：构建你的数据库技能
本文详细介绍了SQL操作指令的各种基础和高级操作，帮助读者掌握SQL数据库技巧。
阅读更多2024-09-17
OpenGL笔记二十一之几何类设计
— 2024-09-16 下午。
阅读更多2024-09-17
UiBot教程：实现复杂流程图的高效方法
我们需要在两个流程块之间传递“字符串格式的系统时间”，所以最简单的方法就是在流程图中定义一个变量。举个例子，我们可以创建一个名为x的流程图变量，这样在流程图所包含的所有流程块中都可以直接使用这个变量。
阅读更多2024-09-17
12 数组——27. 移除元素 ★
给你一个数组nums和一个值val，你需要原地移除所有数值等于val的元素，并返回移除后数组的新长度。
阅读更多2024-09-17
工资重回“3000块”时代
3000元是一个心理价位，但实际上对于许多家庭来说，可能在县城生活，除了基本的生活开销，很难剩下更多的钱。也就是说，如果你的工作收入在这个“五千块定律”所设定的范围内，并且在三年内没有超过平均水平的涨
阅读更多2024-09-17
谷歌向安卓用户推出Gemini Live聊天机器人
即使你的手机处于锁定状态，屏幕处于关闭状态，你也可以开始与助手交谈，而且还可以通过谷歌(Google)的新款Pixel Buds Pro 2无线耳机进行访问，这样你就可以在手机放在包里的时候免提通话。
阅读更多2024-09-17
Linux进阶命令-sed&split
sed（Stream Editor）是一个流编辑器，用于在文本流中进行文本替换和转换操作。它通常用于命令行环境下，可以接受标准输入（stdin）、文件内容或管道输入，并对文本进行修改或处理。
阅读更多2024-09-17
RTMP直播播放器的几种选择
在选择RTMP直播播放器时，需要根据具体的应用场景、平台兼容性、功能需求以及用户体验等因素进行综合考虑。同时，也可以参考其他用户的评价和专业评测来选择最适合的播放器。
阅读更多2024-09-17
Linux套接字
套接字是实现网络通信的核心组件，它提供了灵活且强大的接口，使得开发者能够轻松地在网络环境中构建复杂的应用程序。无论是TCP还是UDP协议，都可以通过适当的套接字类型来满足不同的通信需求.
阅读更多2024-09-17

Python 机器学习求解 PDE 学习项目 基础知识（2）TensorFlow 优化器使用