【生成数据集EXCEL文件】使用生成对抗网络GAN生成数据集：输出生成数据集EXCEL

🕗 发布于 2024-11-22 22:30 生成对抗网络 人工智能 神经网络

本文采用MATLAB编程，使用生成对抗网络GAN生成数据集：输出生成数据集EXCEL格式文件，方便大家使用。

实际工程应用中，由于经济成本和人力成本的限制，获取大量典型的有标签的数据变得极具挑战，造成了训练样本数量非常有限。数据增强方法为解决此类问题提供了简单但有效的思路。深度神经网络强大的特征表示能力和非线性拟合能力源自于对高质量数据集的充足学习，基于深度生成对抗网络（Generative Adversarial Network，GAN）模型的数据增强方法，在学习复杂高维数据分布方面表现出了极其优越的性能，为解决数据问题提供了一个新视角。

生成对抗网络（Generative Adversarial Network，GAN），是一种深度学习模型。GAN网络主要由两部分组成，即生成器（Generator）和判别器（Discriminator）。生成器的任务是接收随机噪声向量作为输入，并尽可能生成与真实数据相似的样本，而判别器则是一个二分类器，旨在区分输入的样本是来自生成器生成的，还是来自真实数据。

在训练过程中，生成器和判别器通过对抗学习的方式相互博弈，生成器的目标是生成足以欺骗判别器的样本，而判别器的目标则是尽可能准确地判断样本的真实性。这种对抗过程持续进行，直到达到纳什均衡，此时生成器的生成能力足够强大，使得判别器无法有效区分真假样本。

GAN网络在多个领域展现了强大的能力，能够生成与训练数据分布相似的新数据，包括但不限于图像生成、图像风格转换、超分辨率、数据增强、视频生成、自然语言处理、医学图像处理以及游戏与虚拟现实等。

本文将生成对抗网络GAN应用在数值型数据集生成中，有效地解决数据不充足的问题。

本文利用机器学习中的经典数据集iris数据集：该数据集有3类，每类50个样本，每个样本4个特征，共150个样本*4个特征。利用GAN生成750个样本数据，并选择用SVM作为分类器（也可以使用其他的分类器）进行分类，用以简单地验证GAN数据的生成质量。生成数据作为训练集用以训练分类器SVM，原始数据作为测试集用以测试。最后结果展示包括了原始数据，和生成数据的分布，概率密度函数分布，每个特征的分布boxplot等。最后svm的分类精度：训练精度96.5333，测试精度96.667。

运行效果如下：

生成的数据集excel样式如下：（含150样本*5=750个样本）

原文地址：https://blog.csdn.net/hustef/article/details/143872447

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：设计模式之建造者模式
下一篇：【操作系统】Linux之网络编程(TCP)（头歌作业）

Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
阅读更多2024-11-23
解决vm虚拟机中ctrl键粘滞问题（一直处于按下状态）
虚拟机中点击鼠标左键没有问题，单独按下键盘也没有问题，但是如果按下键盘的同时在按下鼠标左键就会卡住。而且100%稳定复现。发现问题原因：vm版本的问题，我的版本是17.5.0，升级成17.5.2 bu
阅读更多2024-11-23
第十章 JavaScript的应用
10.1.1 JavaScript简介1 简单性JavaScript 设计之初就考虑到了非专业程序员的使用，因此它的语法相对简单，容易上手。2 动态性JavaScript 是一种解释型语言，代码可以在
阅读更多2024-11-23
非root用户安装CUDA
4.下载完成后执行.run文件，需要添加两个参数，一个是--override，用于跳过某些检查或限制；另一个是--toolkitpath，它表示安装路径，必须是自己目录下面的路径，如果是根目录就会安装
阅读更多2024-11-23
Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
【代码】## Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
阅读更多2024-11-23
【通俗理解】Jensen不等式与变分分布q(z)在积分计算中的应用
Jensen不等式 #变分分布 #积分计算 #期望 #凸函数 #优化问题 #下界估计 #机器学习。
阅读更多2024-11-23
「Mac玩转仓颉内测版27」基础篇7 - 字符串类型详解
本篇将介绍 Cangjie 中的字符串类型，包括字符串的定义、字面量形式、插值表达、常用操作及应用场景，帮助开发者熟练掌握字符串的使用。
阅读更多2024-11-23
数据科学与SQL：组距分组分析 | 区间分布问题
绝对值分布分析也可以理解为组距分组分析。对于某个指标而言，一个记录对应的指标值的绝对值，肯定落在所有指标值的绝对值的最小值和最大值构成的区间内，根据一定的算法，在把这个区间划分为等距离的几个小区间，，
阅读更多2024-11-23
c++编译报C1004错误的原因及解决办法
可能是你的代码文件最后没有正确的结束符，或者是缺少了一些必要的头文件或语句。默认磁盘驱动器没有足够的空间用于临时文件，需要大约两倍于源文件的空间。编译器到达了源文件尾但未解析构造。计算结果为假的 #i
阅读更多2024-11-23
mysql 去重补全取出重复变量函数和存储过程
mysql 去重补全取出重复变量函数和存储过程
阅读更多2024-11-23

【生成数据集EXCEL文件】使用生成对抗网络GAN生成数据集：输出生成数据集EXCEL

相关文章