13 年
手机商铺
公司新闻/正文
375 人阅读发布时间:2025-08-20 10:56
小提琴图是一种结合了箱线图和核密度图特点的可视化工具,既能展示数据的统计分布特征(如中位数、四分位数),又能通过 “violin 形状” 反映数据在不同值上的密度(即数据在某一区间的聚集程度)。
一、如何解读小提琴图的关键信息?
1. 看 “形状”:判断数据分布特征
①对称 vs 偏态
若小提琴左右基本对称(如类似 “倒过来的葫芦”),说明数据接近正态分布;若一侧明显更宽(如左侧宽、右侧窄),则为偏态分布(左偏 / 右偏)。
②峰值数量
若小提琴有多个 “凸起”(即多个宽度峰值),说明数据可能存在多峰分布。
2. 看 “内部统计线”:定位集中趋势和离散程度
①中位数位置
中间横线的高低反映数据的中心位置,不同组的中位数横线位置差异越大,说明组间中心趋势差异越明显。
②四分位数范围
若内部箱体(或上下短线)跨度大,说明数据的中间 50% 数值分布较分散;跨度小则说明中间数据集中。
异常值
若存在大量异常值(远离主体的点),可能提示数据中有极端情况(如测量误差、特殊个体)。
3. 看 “宽度变化”:识别数据聚集区间
小提琴的宽度变化直观展示了数据在不同值上的密集程度:某一区间宽度最大表示该区间是数据的 “众数区间”(数据最集中)。从宽到窄的变化表示数据从密集区向分散区过渡。
4. 组间对比:横向比较不同小提琴
当横轴为分组变量时(如 A、B),可通过以下维度对比组间差异:
①位置
哪组的中位数横线更高 / 更低?
②形状
哪组的分布更对称 / 偏斜?是否存在多峰?
③宽度范围
哪组的数据分布更分散(小提琴整体更“胖”)或更集中(更“瘦”)?
二、实操示例
和元生信云平台的小工具【小提琴图】,直观反映数据的集中趋势、离散程度、异常值等。
2.1数据准备
上传“数据矩阵”,如下。数据应当为3列, 第一列的内容为数值,代表Y轴数据;第二列中的分组变量将作为X轴中的分组;第三列中的分组变量将在X轴分组基础上按照颜色再做区分。

2.2调整“绘图参数”
①特殊参数
添加图形:在小提琴中间额外添加的绘图种类;
统计检验方法:选择使用的统计检验方法;
显著性位置:选择显著性标记的纵向位置,越小则越靠上;
②通用参数
标题:自定义绘图标题,支持中英文;
输出格式:选择输出文件的格式,其中pdf、svg、eps为矢量图格式,jpeg、png、tiff为位图格式,pptx可用于自主修改绘图中的文字、颜色等元素,plotly为html动态网页格式;
宽度、高度:定义绘图的长宽,若输出图形元素过于密集,则可适当调整该参数;
主题:可选择ggplot主题包ggthemes中提供的主题,美化绘图;
图例位置:自定义图例在绘图中的位置
图例方向:自定义图例中多个元素的排列方向
颜色画板:可选择ggsci包中提供的配色画板,适应不同的杂志要求。若需自定义配色,则可选择自定义。
自定义颜色画板:(高级选项)支持自定义颜色画板,请首先在颜色画板选项中选择自定义,并从下拉菜单中选择需要的颜色,若没有需要的颜色,也可以自己输入多个以#开头的16进制颜色码。

提交数据:等待运行结果,分析结果将会在左侧呈现。
2.3下载
下载所需数据,完成作图啦

数据挖掘,从未如此简单!
和元多组学服务
和元生物提供多组学服务(如全外显子测序、转录组、Astral蛋白组、非靶向代谢组、非靶向脂质组、靶向代谢组、16s/ITS/18s扩增子测序、宏基因组、Cut&Tag、MeRIP (m6A)-seq、全基因组甲基化测序、简化甲基化测序等)和单细胞及空间转录组服务(如10x单细胞转录组、10x单细胞转录组及TCR/BCR、墨卓单细胞转录组、10x CytAssist空间转录组、10x HD空间转录组等),致力于为广大生命科学家、医学工作者提供基于多组学技术的科研及临床应用解决方案。
业务咨询:15800353038

