14 年
手机商铺
公司新闻/正文
1177 人阅读发布时间:2025-08-19 11:28
箱线图是一种展示数据分布特征的图表,能直观反映数据的集中趋势、离散程度、异常值等,尤其适合比较多组数据的分布差异。
下限
通常延伸至最小值(或距下四分位数 1.5 倍四分位距的位置,超出部分为异常值)。
下四分位数(Q1)
数据中 25% 的数值小于该值。
中位数(Q2)
数据中 50% 的数值小于该值,反映数据的中心位置。
上四分位数(Q3)
数据中 75% 的数值小于该值。
上限
通常延伸至最大值(或距上四分位数 1.5 倍四分位距的位置,超出部分为异常值)。
四分位数
箱体的底部和顶部分别表示第一四分位数(Q1)和第三四分位数(Q3),箱体的长度代表四分位数间距(IQR),反映数据的分散程度。

①集中趋势差异
比较各组中位数的位置,若中位数差距大,可能存在组间中心位置差异。
②离散程度差异
箱线的高度(IQR)或须的长度反映数据分散程度,箱线越高说明数据越分散。
③分布形态差异
若一组数据的箱线偏上、另一组偏下,可能存在分布不对称的差异;异常值的数量和位置也能反映组间稳定性差异。
④显著性辅助判断
结合假设检验结果,箱线图可直观展示 “显著差异” 在实际数据中的表现。
和元生信云平台的小工具【箱线图】,直观反映数据的集中趋势、离散程度、异常值等。
3.1数据准备
上传“数据矩阵”,如下。第一行表示每个分组中对应的表达值/数值等;第二列表示每一行数值对应的所属分组信息。

3.2调整“绘图参数”
①特殊参数
P 值展示形式:可选择数值,"*" 符号的数量,和不展示 P 值;
统计检验方法:自定义计算P值的方法;
检验组别:定义在哪些组别之间进行差异检验并标注P值,若为空则默认为数据文件第二列中所有组别。请输入两个以上在数据文件第二列中出现过的组别名称,每输入完成一次,通过回车或点击鼠标左键确定输入;
显示离群值:是否以散点的形式显示离群值,注意添加散点后无法显示离群值;
添加散点:将数值表示的点标明出来;
添加缺口:是否输出带凹口形式的箱线图;
散点大小:控制离群值和散点的大小;
分面按表格排序:规定了分面绘图(即数据文件中第三列的组别)的顺序是否按照组名称在数据文件中出现的先后顺序(或采用字母顺序排序);
箱体宽度:控制箱体的宽度,含义为所占百分比;
添加误差线:在箱体两端添加横线;
误差线宽度:控制误差线的宽度。
②通用参数
标题:自定义绘图标题,支持中英文;
输出格式:选择输出文件的格式,其中pdf、svg、eps为矢量图格式,jpeg、png、tiff为位图格式,pptx可用于自主修改绘图中的文字、颜色等元素,plotly为html动态网页格式;
宽度、高度:定义绘图的长宽,若输出图形元素过于密集,则可适当调整该参数;
主题:可选择ggplot主题包ggthemes中提供的主题,美化绘图;
图例位置:自定义图例在绘图中的位置
图例方向:自定义图例中多个元素的排列方向
颜色画板:可选择ggsci包中提供的配色画板,适应不同的杂志要求。若需自定义配色,则可选择自定义。
自定义颜色画板:(高级选项)支持自定义颜色画板,请首先在颜色画板选项中选择自定义,并从下拉菜单中选择需要的颜色,若没有需要的颜色,也可以自己输入多个以#开头的16进制颜色码。

提交数据:等待运行结果,分析结果将会在左侧呈现。
3.3下载
下载所需数据,完成作图啦

数据挖掘,从未如此简单!
立即注册,即刻免费享受SVIP会员福利!
和元生物提供多组学服务(如全外显子测序、转录组、Astral蛋白组、非靶向代谢组、非靶向脂质组、靶向代谢组、16s/ITS/18s扩增子测序、宏基因组、Cut&Tag、MeRIP (m6A)-seq、全基因组甲基化测序、简化甲基化测序等)和单细胞及空间转录组服务(如10x单细胞转录组、10x单细胞转录组及TCR/BCR、墨卓单细胞转录组、10x CytAssist空间转录组、10x HD空间转录组等),致力于为广大生命科学家、医学工作者提供基于多组学技术的科研及临床应用解决方案。
业务咨询:15800353038
