统计分析初级
数据清洗与统计分析流程
从原始表格到可用于论文结果的清洗、描述统计、显著性检验和图表输出流程。
预计耗时:1-3 小时 6 个步骤
操作步骤
1
检查原始数据
Excel / LibreOffice检查字段名、单位、缺失值、重复行、异常值和数据录入错误。
不要直接在唯一原始表上修改,先复制一份工作表。
2
批量清洗与标准化
OpenRefine统一分类名称、修正拼写、合并重复项、批量转换文本和日期格式。
OpenRefine 的操作历史可以导出,便于复现清洗过程。
3
整理分析表
R / Python将数据整理为一行一个样本、一列一个变量的分析格式。
变量名建议使用英文、下划线和简短命名,避免代码中频繁出错。
4
描述统计与可视化
R / Python / Jamovi计算均值、标准差、标准误、箱线图、散点图和分组趋势图。
先画图再做检验,很多异常值和分组问题在图上更容易发现。
5
统计检验
Jamovi / JASP / R根据设计选择 t 检验、ANOVA、相关、回归、非参数检验或混合模型。
统计方法要与试验设计匹配,不能只根据软件菜单随意选择。
6
结果导出
R / Jamovi导出统计表、显著性字母、模型结果和论文图表。
建议同时保存分析脚本和最终结果表,便于论文修改时复算。
流程完成