日记的科学
四十岁的彭尼贝克效应
四十年来,关于写日记的那个经典说法,随着方法的改进反而缩水了。从 Smyth 到 Reinhold,对表达性写作元分析的一次诚实复盘。
四十年前,Journal of Abnormal Psychology 上一项小规模随机试验,请四十六名本科生在连续四个晚上、每晚十五分钟,写下一段亲身经历的创伤。六个月后,写"创伤与情绪"那一组前往校园健康中心的次数,大约只有写琐碎话题对照组的一半。Pennebaker 和 Beall 自己把这个结果称为promising rather than definitive,按他们的报告,F(3, 42) = 2.74,p = .055。[3] 这个限定语没能撑过接下来的四十年。等到这套方案传到健康养生类媒体时,promising 已经变成了表达性写作能增强你的免疫系统、处理创伤、重塑抑郁的大脑回路。四十年过去,四份认真的元分析做下来,谨慎的总结其实比那些标题党,也比与之对应的那种怀疑论调,都要更窄、也更有意思。
没人引用的那个标题数字
写日记这一文献里被引用最多的单一数字,是 Smyth 1998 年的平均效应量,d = 0.47,汇总自十三项随机研究、806 名参与者。[6] 健康养生类作者把这缩写成中等效应,然后就停在这里。几乎没人引用的,是第二份元分析。Frattaroli 在 2006 年用随机效应模型对一百四十六项实验性披露研究、10,994 名参与者做了汇总,得出的总相关为 r = .075,相当于 d ≈ 0.151。[1] 研究数四倍,样本数十三倍,效应却只剩下三分之一左右。
从一次有希望的偶然到一项经典论断
从 Pennebaker 1986 到 Smyth 1998 的这条弧线,是一种范式典型的早期轨迹。一项带有一个临界交互作用的小型首研,打开了这个领域此前没问过的问题。*一段简短的写作任务,到底能不能让某个健康指标动一动?*整个八十年代末和九十年代,这套方案在健康本科生身上、对照琐碎话题,被反复重复。按 Smyth 的汇总,其中十三项试验产生了未加权的 d = 0.47,最大的几个分桶分别是生理功能(d = 0.68)和心理福祉(d = 0.66)。[6] 写作次数和单次时长都没有调节这个效应,两者 p > .10。数字是真的,方案足够简单,写下情绪就能产生可测量的健康效应这一论断,在领域汇总到足够多研究、能正经检验它之前,就已经凝固成了经典版本,而这一切早了足足十年。
缩水
然后这套文献做了所有文献都会做的事。方法变好了。样本量变大了。汇总池扩展到了原始方案从未验证过的人群和结局。汇总后的效应被压缩了。
| study | |汇总后的 d 当量| |
|---|---|
| Smyth 1998 | 0.47 |
| Frattaroli 2006 | 0.15 |
| Frisina 2004 | 0.19 |
| Travagin 2015 | 0.13 |
| Reinhold 2018 | 0.03 |
最干净的同口径对比就在图里。Frattaroli 2006 的抑郁专项分桶报告 r = .073,相当于 d ≈ 0.15。十二年后,Reinhold 等人对三十九项关于身体健康成人抑郁症状的表达性写作 RCT 做了多层元分析。在平均六个月随访点上,长期效应为 g = −0.03,95% 置信区间 [−0.16, 0.09]。[5] 即时后测时存在一个微小但显著的效应(g = −0.09,方向偏向写作组),到第一次随访时就褪去了。Trim-and-fill 估计缺失研究为零。并不存在某种发表偏倚的人造痕迹在抬高早年那批数字;在更严格的汇总下,健康成人的抑郁效应根本没能撑过长期随访。
标题数字所掩盖的异质性
Frattaroli 总体上的 r = .075,对任何单一结局的描述都很糟糕。主观影响评分,也就是参与者本人对写作体验的回顾性判断,是 r = .159。自报健康症状是 r = .072。生理功能是 r = .060。心理健康是 r = .056。健康行为,也就是唯一一个有人会去查你是不是少抽了点烟、多运动了一点的结局桶,是 r = .007,在十项研究中没能跨过显著性这条线。[1] 比起人们可测量的健康,这套方案更能撼动的是参与者对这次写作练习的感受。
Spending 20 min a day for 3 days on an independent writing activity producing an effect halfway between small and medium is, in this author's opinion, quite impressive.
针对这套方案做过的最大规模元分析的作者,把这个效应描述为在最优条件下、在她最大的那个结局桶里,halfway between small and medium。读到这个量级,这套文献既不是健康养生口号,也不是对它的全盘否定。
近期元分析所排除的人群
Reinhold 关于抑郁的零长期结果,乍看像是一次干净利落的反驳。一行脚注让事情变复杂了。2018 年的样本明确排除了 PTSD 患者,也排除了关于身体疾病的研究,理由站得住脚:这些亚组本身就属于独立的干预,和自助式设计放在一起汇总效果不好。[5] 而恰恰是这些亚组,正是 Smyth 和 Frattaroli 当年报告出最大效应的地方。创伤人群和躯体疾病样本。这次缩水里,一部分是真正的方法学进步,另一部分则是有意排除了那些原始信号叫得最响的亚组。
仔细读下来,这次缩水并不是一个故事。它是对问题本身的一次澄清。Smyth 和 Frattaroli 汇总的,是这个领域自 1986 年以来一直在研究的整个语料库。写创伤的健康本科生。写诊断的癌症患者。家庭照护者,睡眠呼吸障碍者,纤维肌痛患者样本。汇总后的 d,描述的是这种混合语料库上平均会发生什么,其中分量最重的临床亚组在做主要的算术工作。Reinhold 把样本限制在身体健康成人,把 PTSD 当作一个独立的临床干预问题去处理,问的是更窄的当代版本。*简短的自我导向写作,对非临床成人的抑郁,在六个月随访时是否有帮助?*答案是零。早先那个答案是小到中等。两者之间并不矛盾。它们是对不同样本上不同问题的回答,对这套文献的诚实读法,必须把这两个问题都放在视野里。
青少年文献也指向同一方向。Travagin 等人汇总了二十一项关于十到十八岁青少年表达性写作的研究,得到总体 g = 0.127,最大的信号出现在剂量最高、写作主题最具体的地方。[7] Frisina 更早一些对临床人群的元分析报告 d = 0.19,预设的对比表明躯体健康结局(d = 0.21)跑赢了心理结局(d = 0.07,不显著)。[2] 在领域研究过的这些人群里,汇总效应都很小,最稳定地存活下来的,是躯体信号,而不是情绪信号。
四十年里活下来的是什么
文献中关于认知机制的那一面,比效应量撑得更久。Pennebaker 1997 年发表在 Psychological Science 上的综述,报告了写作过程中可测量的语言变化,因果词如 because、洞察词如 understand 的使用频率在上升,独立评分者也观察到,组织散乱的描述在写作的最后一天变成了连贯的叙述。[4] 按 Pennebaker 自己的解读,承载这种效应的,是把经验翻译成结构化语言,而不是这套原始方案当年所围绕的宣泄。这套机制并不需要一段三十分钟的创伤写作。它需要的,只是把一件具体的事情,努力放进具体的字句里。
这条写日记的科学支柱,因为这次缩水而失去的,是那句口号。它保留下来的,是 Burton 与 King 那个两分钟奇迹的下限发现,是那条被遗忘的免疫支线,在身体上留下的微小但持久的信号,以及 Pennebaker 1997 年描述过的那种认知翻译。同样的缩水模式也出现在感恩文献里,按对照严格度排序的十二项感恩 RCT显示,随着对照收紧,效应也在塌缩。它们都不依赖 d = 0.47。它们依赖的,是把一句具体的话写到纸上这个动作。这套文献四十年的弧线,是对一个早期估计的缓慢修正,那个估计原本就注定会在严肃的元分析下被压缩。读到它实际的那个量级上,表达性写作是心理学里相当奇特的、那种没有消失的小效应之一。
参考资料。
- 1.Frattaroli, J. (2006). Experimental disclosure and its moderators: A meta-analysis. Psychological Bulletin 132(6), 823–865.doi:10.1037/0033-2909.132.6.823
- 2.Frisina, P.G. et al. (2004). A meta-analysis of the effects of written emotional disclosure on the health outcomes of clinical populations. Journal of Nervous and Mental Disease 192(9), 629–634.doi:10.1097/01.nmd.0000138317.30764.63
- 3.Pennebaker, J.W. & Beall, S.K. (1986). Confronting a traumatic event: Toward an understanding of inhibition and disease. Journal of Abnormal Psychology 95(3), 274–281.doi:10.1037/0021-843X.95.3.274
- 4.Pennebaker, J.W. (1997). Writing About Emotional Experiences as a Therapeutic Process. Psychological Science 8(3), 162-166.doi:10.1111/j.1467-9280.1997.tb00403.x
- 5.Reinhold, M. et al. (2018). Effects of expressive writing on depressive symptoms — A meta-analysis. Clinical Psychology: Science and Practice 25(1), e12224.doi:10.1111/cpsp.12224
- 6.Smyth, J.M. (1998). Written emotional expression: Effect sizes, outcome types, and moderating variables. Journal of Consulting and Clinical Psychology 66(1), 174–184.doi:10.1037/0022-006X.66.1.174
- 7.Travagin, G. et al. (2015). How effective are expressive writing interventions for adolescents? A meta-analytic review. Clinical Psychology Review 36, 42–55.doi:10.1016/j.cpr.2015.01.003