是什么
统计素养是理解和批判数据论证的能力:明白P值小于0.05不代表结论为真,统计显著不等于实际重要,相关不等于因果,样本偏差能让数据集体说谎。还包括理解效应量、置信区间、多重比较陷阱与回归均值等核心概念。
为什么重要
缺乏统计素养的研究者很容易自欺:反复检验直到出现显著结果(P值操纵)是可重复性危机的重要推手。经典反例俯拾皆是——冰淇淋销量与溺水人数高度相关,真正原因是夏天;某地区医院死亡率最高,可能只因它收治了最重的病人。统计学家图基说过:数据未必含有答案,但一定含有诱惑。
如何应用
- 看到显著结果先问效应量与置信区间,再问样本如何抽取。
- 分析前预设假设与检验方法,杜绝事后翻找显著性。
- 用模拟和可视化建立直觉,而不只是背公式。