【从感知机到神经网络】

🕗 发布于 2024-10-13 02:51 神经网络 人工智能 深度学习

感知机

什么是感知机

公式、框图表示

直观举例

根据身高体重判断胖瘦的感知机。

1、根据已知样本训练出一条直线，用于对非训练样本进行分类，这条直线就是感知机模型。

三维情况下感知机模型是一个平面

感知机的缺陷

缺陷原因

不能处理异或问题，换句话说，感知机只能处理线性二分问题。

对于以下二分问题：

前三种情况都能用一条直线分类，第四种异或运算不能直线可分，单个感知机无法解决。

克服缺陷

如何解决异或问题呢？可以使用多个感知机进行叠加。

从线性变换角度理解感知机

将一组向量（样本）经模型的参数矩阵变换后变为另一组向量。

从感知机到神经网络

神经网络的组成

感知机模型

神经网络模型

对于非线性问题，单个感知机无法实现，从上面对感知机介绍可知，多个感知机的叠加可以解决非线性问题，所以神经网络模型可以有多个感知机叠加组成，从而解决非线性问题：（下图由6个感知机组成）

说明：

（1）每一个节点都和下一层的节点全部相连，叫做全连接网络。

（2）数据的传播是单向的，会朝着神经网络一直向前传播，叫做前馈神经网络

直观理解损失函数

本质：两个模型之间的差别。

神经网络训练的模型（机器的认知）与人心中的模型（人的认知）之间是有差别的，训练的目的是让这个差别减小，而神经网络的模型与人心中的模型是无法用同一种度量方式进行比较的，可以想象为在两个模型在两个空间，而这两个空间之间也有一个接口，这个接口是什么呢？即是让两个空间中的两个模型对同一批目标进行功能实现，通过某种方法得到两种实现之间的差距，进而调整机器空间中的模型。以下是三种通过这个接口比较两个模型的两种实现之间差别的三种方法。

最小二乘法

顾名思义：最小二乘即“最小”：min、“二乘”：平方。即 $min(\sum_{i=1}^{n})(y_{i}-y\hat{}_{i})^{2}$

优点：（1）简洁易懂（2）全程可导

缺点：（1）计算麻烦，在复杂的神经网络中一般不用

最大似然估计

例子

举一个简单的例子，抛一枚质地均匀的硬币，正反面朝上的概率都是1/2，所以我们可以认为在现实世界抛硬币大概率就会有一半正面，一半反面。

那么抛一枚质地不均匀的硬币，抛了10次，前7次正面，后3次反面（记为事件A），那么若要问抛掷这枚质地不均匀的硬币正面概率和反面概率分别为多少的可能性最大？

我们可能会毫不犹豫地回答，正面地概率是0.7，反面概率是0.3地可能性最大，即由这个结果可以估计正反面概率是7：3的可能性最大。

下面来定量计算不同正反面概率的情况下事件A发生的可能性：

先验概率0.1：0.9的概率为： $P(A|B_{1})= 0.1^{7}\cdot 0.9^{3}$

先验概率0.2：0.8的概率为： $P(A|B_{2})=0.2^{7}\cdot 0.8^{3}$

先验概率0.3：0.7的概率为： $P(A|B_{3})=0.3^{7}\cdot 0.7^{3}$

先验概率0.4：0.6的概率为： $P(A|B_{4})=0.4^{7}\cdot 0.6^{3}$

先验概率0.5：0.5的概率为： $P(A|B_{5})=0.5^{7}\cdot 0.5^{3}$

先验概率0.6：0.4的概率为： $P(A|B_{6})=0.6^{7}\cdot 0.4^{3}$

先验概率0.7：0.3的概率为： $P(A|B_{7})=0.7^{7}\cdot 0.3^{3}$

先验概率0.8：0.2的概率为： $P(A|B_{8})=0.8^{7}\cdot 0.2^{3}$

先验概率0.9：0.1的概率为： $P(A|B_{9})=0.9^{7}\cdot 0.1^{3}$

计算可得先验概率为0.7：0.3时事件A发生的概率最大。神经网络解决这个问题的时候正是为了寻找这个先验概率（W和b）。

交叉熵

“交叉熵”如何做损失函数？打包理解“信息量”、“比特”、“熵”、“KL散度”、“交叉熵”_哔哩哔哩_bilibili

原文地址：https://blog.csdn.net/m0_56997192/article/details/142876334

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：PostgreSQL学习笔记五：数据库基本操作
下一篇：IBM Flex System服务器硬件监控指标解读

雷池社区版本SYSlog使用教程
雷池会对恶意攻击进行拦截，但是日志都在雷池机器上显示如何把日志都同步到相关设备进行统一的管理和分析呢？如需将雷池攻击日志实时同步到第三方服务器, 可使用雷池的 **Syslog 外发** 功能
阅读更多2024-10-13
小米电机与STM32——CAN通信
背景介绍：为了利用小米电机，搭建机械臂的关节，需要学习小米电机的使用方法。计划采用STM32驱动小米电机，实现指定运动，为此需要了解他们之间的通信方式，指令写入方法等。花了很多时间学习，但网络上相关资
阅读更多2024-10-13
Jenkins maven 编译一些问题
另外，要触发自动构建，需要勾选，Poll SCM (poll source code management) 以及 Build when a change is pushed to GitLab 或者
阅读更多2024-10-13
【Jenkins】2024 最新版本的 Jenkins 权限修改为 root 用户启动，解决 permission-denied 报错问题
【代码】【Jenkins】2024 最新版本的 Jenkins 权限修改为 root 用户启动，解决 permission-denied 报错问题。
阅读更多2024-10-13
Jenkins---01
一. 持续集成工具什么是敏捷开发敏捷开发以用户的需求进化为核心，采用迭代、循序渐进的方法进行软件开发。在敏捷开发中，软件项目在构建初期被切分成多个子项目，各个子项目的成果都经过测试，具备可视、可集成和
阅读更多2024-10-13
论文笔记：RelationPrompt :Zero-Shot Relation Triplet Extraction
提示学习关系三元组抽取
阅读更多2024-10-13
Javascript笔试题目（三）
在客户端（通常是浏览器），开发者定义一个全局函数，这个函数将作为回调函数来接收服务器返回的数据。
阅读更多2024-10-13
抖音小游戏画图&位置移动
抖音小游戏canvas画图
阅读更多2024-10-13
k8s、prometheus、grafana数据采集和展示的链路流程
对于k8s节点和pod的性能和资源使用情况的监控，常用prometheus和grafana的组合来实现。metrics server监控组件定期从kubelet获取这些数据，转换成k8s API可以识
阅读更多2024-10-13
基于GeoScene Pro的开源数据治理与二维制图规范化处理智能工具箱
该工具箱基于GeoScene4.0+/ArcGIS Pro平台，结合Python开源工具，提供了数据治理与二维制图规范化处理的全面解决方案，旨在解决GIS应用中数据转换、检查、治理和制图数据标准化处理
阅读更多2024-10-13