生信数据分析——绘制差异热图

🕗 发布于 2024-04-03 11:17 数据分析数据挖掘 r语言学习方法 大数据

生信数据分析——绘制差异热图

差异分析的热图（Heat Map）在生物信息学数据分析中，特别是在基因表达差异分析中，是一个非常直观和有用的工具。

本教程将从导入的数据结构开始，一步步带大家在R中绘制好看的热图，最后对热图进行解读，确保读者理解代码的同时学会解读热图里的每个元素所代表的意思。

首先来看一下最终的热图长啥样：
在这里插入图片描述

热图的构建基于两个主要的数据：

表达矩阵：行为基因，列为样本的表达矩阵，只要是能反应每个样本不同基因表达水平即可。

分组信息表：与样本对应，要明确知道每个样本属于哪个条件分组。

注：绘制差异热图不需要用到差异分析的结果，但我这里仅展示上下调前10个基因的表达热图，所以用到了差异分析的结果

本项目以GSE73461数据集(芯片数据)展示热图绘制过程
实验分组：疾病组（77例），对照组（55例）
R版本：4.2.2
R包：ComplexHeatmap，tidyverse

废话不多说，代码如下：

设置工作空间：

rm(list = ls()) # 删除工作空间中所有的对象
setwd('/XX/XX/XX') # 设置工作路径
if(!dir.exists('./01_DEGs')){
   
  dir.create('./01_DEGs')
} # 判断该工作路径下是否存在名为01_DEGs的文件夹，如果不存在则创建，如果存在则pass
setwd('./01_DEGs/') # 设置路径到刚才新建的01_DEGs下

加载包：

library(ComplexHeatmap)
library(tidyverse)

导入表达矩阵：train_data

注：芯片数据处理过程参考之前的教程——数据处理（GEO数据库——芯片数据）

train_data <- read.csv('../../00_rawdata/GSE73461/dat.GSE73461.csv', row.names = 1, check.names = F)

train_data如下图所示，行名是基因，列名是样本名，图中数字代表基因表达量，这样就能获取到每个基因在不同样本中的表达。
在这里插入图片描述

导入分组信息表：group，并根据分组信息简单排序

group <- read.csv('../../00_rawdata/GSE73461/group.GSE73461.csv')
group <- group[order(group$group), ] ## 根据分组信息简单排序
table(group$group)
train_data <- train_data[, group$sample] ## 保证表达矩阵与这个分组信息表对应

group 如下图所示，第一列是样本ID，第二列是样本对应的分组，这样就能获取到每个样本对应的条件分组。
在这里插入图片描述

导入差异分析结果（limma/DESeq2都可以）：

DEG <- read.csv('../../01_DEGs/GSE73461/DEG_all.csv'

原文地址：https://blog.csdn.net/weixin_49878699/article/details/136178777

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基于SpringBoot和Vue的房产销售系统的设计与实现
下一篇：ChatGPT在大气科学领域建模、数据分析、可视化与资源评估中的高效应用及论文写作

[Azure PL300 Certified] 数据分析概论与定义
数据分析是标识、清除、转换和建模数据的过程，用于发现有意义和有用的信息。然后通过报表将数据制作成故事进行分析，支持关键的决策过程。
阅读更多2024-11-18
什么是微服务?
微服务是一种经过良好架构设计的分布式架构方案
阅读更多2024-11-18
leetcode-8-字符串转整数
题解:代码:
阅读更多2024-11-18
docker更新镜像源
1. 阿里云镜像加速器：https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors2. 腾讯云镜像加速器：https://cloud.ten
阅读更多2024-11-18
21.3D surface
【代码】21.3D surface。
阅读更多2024-11-18
2. Django中的URL调度器 (自定义路径转换器)
路径转换器是一种 URL 模式的匹配工具，它不仅能够验证路径段的格式，还可以将匹配的路径段传递给视图函数。: 匹配一个整数。: 匹配任意非空字符串，不包括斜杠 /。: 匹配字母、数字、下划线或连字符。
阅读更多2024-11-18
【c++入门】打开新世界大门之初遇c++
在学习了c语言，初阶数据结构后，我们正式走进c++世界大门目录前言一、认识c++二、缺省参数三、函数重载四、引用4.1什么是引用？4.2 使用场景4.2.1 做参数4.2.2做函数返回值4.3引用和指
阅读更多2024-11-18
从零开始使用GOT-OCR2.0——多模态通用型OCR（非常具有潜力的开源OCR项目）：项目环境安装配置 + 测试使用
本文是多模态通用型OCR模型的环境安装和测试部分
阅读更多2024-11-18
WPF如何全局应用黑白主题效果
灰白色很多时候用于纪念，哀悼等。那么使用WPF如何来做到这种效果呢？要实现的这种效果，我们会发现，它其实不仅仅是要针对图片，而是要针对整个窗口来实现灰白色。如果只是针对图片的话，我可以可以对图片进行灰
阅读更多2024-11-18
【GNU】gcc -O编译选项 -Og -O0 -O1 -O2 -O3 -Os
GCC 提供的-O系列选项用于优化代码。这些选项可以控制编译器对代码进行优化的程度和类型，从而提高代码的性能、减小代码体积或优化其他特性。
阅读更多2024-11-18

生信数据分析——绘制差异热图

生信数据分析——绘制差异热图

相关文章