日记的科学
十二项感恩 RCT 按对照严谨度排序
十二项感恩 RCT 按其所控制的变量排序。严谨度上升,效应崩塌。这是关于感恩日记研究的诚实读法。
感恩处方已经硬化为口号。Three things, every morning, for happiness. 口号背后是大约三十年的随机对照试验和三项严肃的元分析,而元分析说的并不是口号说的话。感恩有效,面对弱对照时,有那么一点。把它和任何同等长度的写作练习比较,大部分效应就消失了。这篇文章按对照的严谨度给十二项感恩 RCT 排序,然后看着效应量随对照变难而崩塌。主张的大小应当与得出它的检验的严谨度相匹配。
击穿感恩故事的那个问题
故事源自 Emmons 与 McCullough 的 2003 年研究,主题是 counting blessings versus burdens。[5] 三项简短的试验,效应中等。被传开的那个数字是研究 1 的 d ≈ 0.42,对照组是日常烦恼。二十年来的消费类健康写作引用 Emmons,到此打住。
本应结束这场对话的两项元分析是 Davis 2016(三十二个样本)和 Cregg 与 Cheavens 2021(二十七项 RCT,N 为 3,675)。[3][2] 它们提出了一个几乎没有任何消费类写作触及的方法论问题。Effective compared to what? 这一表述出自 Wood、Froh 与 Geraghty 的 2010 年综述,那是经典的批评。[8] 如果对照是 do nothing,效应是中等的。如果对照是 do anything else of the same length,效应是小的。如果对照是 do another positive-psychology exercise of equal expectancy,效应大致为零。
对照的四个层级
试验按感恩被对比的对象进行排序。
- 等待名单或仅做测量。感恩组写作。对照组什么也不做。任何改善都可能源于注意、预期或自我监测。这是该领域使用的最弱的对照。
- 负性事件日记。对照组记录烦恼或不愉快事件。比什么都不做要好,但对比是感恩对上对错事的纠结,而不是感恩对上一个公平的替代。
- 匹配活动。对照组写日常事件、每周活动、心情,或长度与结构相近的回忆。文献从这里开始变得严谨。
- 心理上活跃的对照。对照组执行另一项预期相近的积极心理学任务。最佳可能自我书写、善行、早期回忆写作、明日待办清单。这是最艰难的对比,也最贴近真实读者实际面临的选择。
这个层级递进很重要,因为那个营销主张,gratitude rewires your brain,是一个层级一的主张,建立在层级一的证据上,却被悄悄延伸到超出层级三和层级四试验所能支持的范围。
图表,模式
从 Cregg 与 Cheavens 2021 年的语料中抽出十二项试验,大致按对照严谨度排列。效应量是 Hedges' g 在抑郁症状上的绝对值。y 轴朝向 in favour of gratitude.
| 研究(对照类型) | |Hedges' g| |
|---|---|
| Cheng 2015 (waitlist) | 0.64 |
| Booker 2017 (waitlist) | 0.45 |
| Southwell 2017 (waitlist) | 0.33 |
| O'Leary 2015 (waitlist) | 0.28 |
| Watkins 2015 (matched) | 0.6 |
| Lambert 2012 (matched) | 0.36 |
| Jackowska 2016 (matched) | 0.35 |
| Kerr 2015 (matched) | 0.34 |
| Manthey 2016 (active) | 0.22 |
| Mongrain 2012 (active) | 0.21 |
| Sergeant 2011 (active) | 0.05 |
| Lyubomirsky 2011 (active) | 0.02 |
按样本量计算最大的四项试验都落在活跃对照层。Sergeant 2011,N 为 514;Manthey 2016,N 为 300;Lyubomirsky 2011,N 为 208;Mongrain 2012,N 为 190。这四项给出的 g 绝对值最多 0.22,其中两项的效应与零无法区分。样本更小、对照更弱的试验产生了消费类健康网站引用的那些头条数字。
Cregg 的合并结果与图表完全一致。对比等待名单对照,感恩使抑郁症状降低,g = −0.51,中等效应。对比在时间和结构上相匹配的活跃对照,效应崩塌至 g = −0.18。剔除两个离群值(Geraghty 2010、Ki 2009)后,抑郁效应缩小了 26%,焦虑效应变得不显著。
效应在哪里有,在哪里没有
Davis 2016 在三年前就已经得出同样的结论,数字更干净。在三十二个样本中,感恩在心理福祉上击败了仅做测量的对照,d = 0.31。对比心理上活跃的对照,d = −0.03。对发表偏倚做 trim-and-fill 校正后,匹配活动那一段的优势崩塌至 d = 0.02。作者用平实的语言写道,感恩干预可能主要是通过安慰剂效应起作用的。
gratitude interventions had a medium effect when compared with waitlist-only conditions, but only a trivial effect when compared with putatively inert control conditions involving any kind of activity.
Dickens 2017 那一系列五十六项元分析,依据的是另一组研究集合,落在了同一个结论上。福祉效应从对中性对照的 d ≈ 0.31 降到对活跃对照的 d ≈ 0.17。[4] 横跨十年的三项元分析,纳入标准重叠但并不相同,全部收敛到同一个调节变量上。对照类型解释了消费类文献归因于感恩本身的大部分方差。
那么睡眠、免疫、另一条分支呢
最强的非心理信号是睡眠。Boggiss 2020 综述发现,在测量了主观睡眠质量的八项 RCT 中有五项显示其有所改善。[1] 其他生理健康指标(炎症、血压、血糖控制)则模棱两可或检验力不足。在感恩文献中,睡眠是唯一一个角落,在这里,即便面对胜任的安慰剂对照,也仍会留下真实的信号,并且它指向了机制。睡前列出三件事,无论是感恩还是别的什么,都会替换掉入睡前的认知唤起。Scullin 2018 多导睡眠图试验将年轻成人随机分组,让他们花五分钟写一份具体的待办清单,或一份已完成任务的清单。[6] 待办组入睡快了九分钟,均值 15.8 对 25.1,Cohen's d = 0.63。起作用的是睡前对注意的结构化。睡前的感恩驱赶掉那个本来要循环播放的东西,和一份计划清单所做的,是同一份工。这个信号呼应着 更早的表达性写作文献所留下的东西。
一个更安静的,保留这种练习的理由
读完三十年的试验并不是说感恩日记什么都不做。对一个去条件化的基线而言,几乎任何结构化的积极写作练习都会带来小而真实的好处。感恩只是几种结构化练习中的一种。它无法仅凭一个在胜任安慰剂下消失的元分析效应,就为每日仪式提供正当性。
留下来的东西更谦卑。把两分钟的注意放在某件进展顺利的事情上,嵌入 一种最小有效练习的科学 中,是值得做的。把它和 一行日志 的其余部分配在一起,并问 compared to what。当营销主张安静下来后,剩下要争论的,就是这种练习本身。
参考资料。
- 1.Boggiss, A.L. et al. (2020). A systematic review of gratitude interventions: Effects on physical health and health behaviors. Journal of Psychosomatic Research 135, 110165.doi:10.1016/j.jpsychores.2020.110165
- 2.Cregg, D.R. & Cheavens, J.S. (2021). Gratitude interventions: Effective self-help? A meta-analysis of the impact on symptoms of depression and anxiety. Journal of Happiness Studies 22(1), 413–445.doi:10.1007/s10902-020-00236-6
- 3.Davis, D.E. et al. (2016). Thankful for the little things: A meta-analysis of gratitude interventions. Journal of Counseling Psychology 63(1), 20–31.doi:10.1037/cou0000107
- 4.Dickens, L.R. (2017). Using gratitude to promote positive change: A series of meta-analyses investigating the effectiveness of gratitude interventions. Basic and Applied Social Psychology 39(4), 193–208.doi:10.1080/01973533.2017.1323638
- 5.Emmons, R.A. & McCullough, M.E. (2003). Counting blessings versus burdens: An experimental investigation of gratitude and subjective well-being in daily life. Journal of Personality and Social Psychology 84(2), 377–389.doi:10.1037/0022-3514.84.2.377
- 6.Scullin, M.K. et al. (2018). The effects of bedtime writing on difficulty falling asleep: A polysomnographic study comparing to-do lists and completed activity lists. Journal of Experimental Psychology: General 147(1), 139–146.doi:10.1037/xge0000374
- 7.Seligman, M.E.P. et al. (2005). Positive psychology progress: Empirical validation of interventions. American Psychologist 60(5), 410–421.doi:10.1037/0003-066X.60.5.410
- 8.Wood, A.M. et al. (2010). Gratitude and well-being: A review and theoretical integration. Clinical Psychology Review 30(7), 890–905.doi:10.1016/j.cpr.2010.03.005