生物信息学基础教程
5. 生物信息学数据可视化
高质量的数据可视化是生物信息学研究的关键环节。推荐使用在线平台 微生信(Bioinformatics.com.cn) 进行快速、美观、可发表级的图表绘制。该平台无需编程基础,支持多种组学数据类型的可视化。以下按功能模块分类介绍常用图表及其生物学意义。
基础绘图(适用于各类数据探索与展示)
- 带连线注释的甜甜圈图(Donut Pie with Annotation):用于展示分类数据的比例构成,并通过连线标注具体数值,适合多组别占比对比,如不同组织来源样本比例。
- 大饼拉小饼图(Pie with Sub-pie):主图展示整体分布,子图细化某一类别内部结构,适用于嵌套层级数据,如基因功能富集的二级分类。
- 2.5d柱状图(Bar Chart 2.5D):三维视觉效果的柱状图,增强可读性,常用于比较多个样本或处理组的表达量或计数。
- 渐变树形图(Gradient Treemap):用矩形面积表示值大小,颜色深浅表示另一维度(如 p 值),适合展示通路富集结果或基因家族分布。
- 水平条形图(Horizontal Bar Chart):横向排列条形,便于阅读长标签,常用于 GO/KEGG 富集分析中路径名称较长的情况。
- 平滑线图(Smooth Line Plot):展示连续变量随时间或梯度的变化趋势,如药物浓度响应曲线、时间序列表达动态。
- 矩形漏斗图(Rectangle Funnel):展示流程中各阶段的转化率,如测序数据质控流程(raw reads → clean reads → mapped reads)。
- 成比例面积文氏图(Proportional Venn Diagram):展示多个集合之间的交集与特有元素,面积按数量缩放,适用于差异基因集合比较(如 DESeq vs FQ)。
- 3D饼图(3D Pie Chart):立体化饼图,增强视觉冲击力,适合展示单个样本中不同成分的组成比例(如转录本类型分布)。
- 2D饼图(2D Pie Chart):标准二维饼图,简洁直观地展示分类数据比例,如样本分组占比、基因功能类别分布。
- 3D面积图(3D Area Chart):三维堆叠面积图,展示多变量随时间或条件变化的趋势,适用于多组实验的时间动态表达分析。
- 堆叠面积图(Stacked Area Chart):展示总量及其组成部分随时间的变化,如不同基因在某通路中的表达贡献。
- 堆叠线图(Stacked Line Chart):多条线叠加显示,体现各组分对总体趋势的贡献,适合展示基因表达模式聚类。
- 垂直柱状图(Vertical Bar Chart):最常用的柱状图形式,用于比较不同类别或样本间的数值大小,如不同处理组的平均表达量。
- 箱体图 / 盒子图(Boxplot):展示数据分布的五数概括(最小值、下四分位、中位数、上四分位、最大值),识别异常值,常用于比较不同组间表达差异。
- 水平 / 垂直小提琴图(Violin Plot):结合箱线图与密度估计,全面展示数据分布形态,比箱线图更清晰地反映偏态或多峰特征。
- 直方图,带拟合(Histogram with Fit):展示连续型数据的频次分布,并叠加正态分布曲线,用于检验数据是否符合某种分布(如表达值正态性检验)。
- 多组垂直柱状图(Multi-group Vertical Bar):比较多个样本或处理组的表达量,支持分组配色,适合展示多因子实验结果。
- 堆叠柱状图(Vertical Stack Bar):展示各组内不同类别的构成比例,如不同样本中不同细胞类型的占比。
- 堆叠条形图(Horizontal Stack Bar):横向堆叠条形,便于比较多个样本中各类别的相对比例。
- 三维柱状图(3D Bar Chart):三维空间展示数据,增强可视化效果,适合展示两因素交互作用(如时间 × 处理)。
- 底部汇聚柱状图(Aggregation Bar):从底部汇聚的柱状图,强调累积效应,可用于展示累计表达量或通路激活程度。
- 甜甜圈图(Donut Chart):环形饼图,中心留空,常用于展示分类数据比例,如基因功能分类或样本来源分布。
- 三维柱状图(3D Bar Chart):同上,三维立体柱状图,增强视觉表现力。
- 双层饼图(Two-layer Pie):内外两层饼图,外层为主分类,内层为子分类,适合展示层次化数据结构。
- 圆形比例图(Percentage Half Circle):半圆扇形图,以角度表示比例,常用于展示单一指标的百分比构成。
- 双层甜甜圈图(Two-layer Donut):双层环形图,用于展示两层嵌套分类数据,如物种 × 组织类型。
- 梯形漏斗图(Trapezoid Funnel):梯形形状的漏斗图,展示流程转化率,如筛选候选基因的流程步骤。
- 小提琴图(Violin Box):结合小提琴图与箱线图,既展示分布密度又突出统计位置,适用于复杂分布数据的精细比较。
- 4/5/6/7元文恩图(Venn Diagram):支持最多七组集合的交集可视化,用于比较多个实验条件下的差异基因重叠情况。
- 成比例面积图(Proportional Area Chart):面积大小按数值缩放,适合展示不同类别的重要性或丰度,如通路富集得分。
- 两组成比例面积图(Proportional Circle Area):两个圆形区域,面积按比例划分,用于比较两类数据的构成差异。
- errorbar柱状图(Errorbar Bar):柱状图加误差棒,展示均值 ± 标准差或置信区间,适用于重复实验数据的统计比较。
- 矩阵饼图(Pie Matrix):多个小饼图组成矩阵,每个代表一个样本或类别,适合展示多样本的分类分布。
- 4组面积图(Square Area):四个区域的面积图,用于比较四个组别的数据趋势,如不同时间点的表达变化。
- 哑铃图(Dumbbell Chart):连接两个点的线段,展示同一对象在不同条件下的变化,如基因在对照 vs 实验组的表达变化。
- 填充柱状图(Link Fill Bar):柱状图之间用线条连接,强调连续性,适合展示时间序列或梯度实验结果。
- 分组_回归的散点图(Scatter Fit Group):分组散点图加回归线,展示不同组别间变量关系及趋势,如基因表达与临床指标相关性。
- 带连线的box图(Dot Line Box):箱线图加点连成线,展示个体数据点趋势,适用于纵向研究或重复测量设计。
- 带bar的饼图(Bar of Pie):主饼图展示主要类别,次要类别单独用条形图展示,解决小比例类别难以辨识的问题。
- 华夫饼图(Waffle Chart):由小方块组成的网格图,每个方块代表一个单位,适合展示百分比构成,如样本分组比例。
- 漏斗图(Funnel Chart):展示流程中各阶段的转化率,如测序数据过滤流程或患者筛选流程。
- 雷达图(Radar Chart):多维数据可视化,展示多个指标的综合表现,如基因在多个功能通路中的富集得分。
- 一条/多条线图(Multi-line):多条折线图,比较多个变量随时间或条件的变化趋势,如多个基因的表达动态。
- 蝴蝶图(Butterfly Horizontal Bar):左右对称条形图,用于比较两个组别在相同类别上的差异,如上调 vs 下调基因数。
- 填充线图(Filled Area):折线图下方填充颜色,强调面积大小,适合展示累计值或趋势范围。