统计分析初级

数据清洗与统计分析流程

从原始表格到可用于论文结果的清洗、描述统计、显著性检验和图表输出流程。

预计耗时:1-3 小时 6 个步骤

操作步骤

1

检查原始数据

Excel / LibreOffice

检查字段名、单位、缺失值、重复行、异常值和数据录入错误。

不要直接在唯一原始表上修改,先复制一份工作表。

2

批量清洗与标准化

OpenRefine

统一分类名称、修正拼写、合并重复项、批量转换文本和日期格式。

OpenRefine 的操作历史可以导出,便于复现清洗过程。

3

整理分析表

R / Python

将数据整理为一行一个样本、一列一个变量的分析格式。

变量名建议使用英文、下划线和简短命名,避免代码中频繁出错。

4

描述统计与可视化

R / Python / Jamovi

计算均值、标准差、标准误、箱线图、散点图和分组趋势图。

先画图再做检验,很多异常值和分组问题在图上更容易发现。

5

统计检验

Jamovi / JASP / R

根据设计选择 t 检验、ANOVA、相关、回归、非参数检验或混合模型。

统计方法要与试验设计匹配,不能只根据软件菜单随意选择。

6

结果导出

R / Jamovi

导出统计表、显著性字母、模型结果和论文图表。

建议同时保存分析脚本和最终结果表,便于论文修改时复算。

流程完成