日記の科学
四十年目のペネベイカー効果
日記の定説的な効果は、研究の精度が上がるにつれて縮んだ。Smyth から Reinhold まで、四十年分のエクスプレッシブ・ライティングのメタ分析を正直に読む。
四十年前、Journal of Abnormal Psychology に掲載された小さな 無作為化試験は、四十六人の学部生に、四夜連続で十五分間、個人的な トラウマについて書くよう求めた。半年後、トラウマと感情を書いた群の 学生は、つまらない話題を書いた対照群と比べて、大学の保健センターを 訪れた回数がおよそ半分だった。Pennebaker と Beall は、その結果を promising rather than definitive(決定的ではないが有望)と呼び、 本人たちの報告では F(3, 42) = 2.74、p = .055 だった。 [3] この留保は、続く四十年を生き延び なかった。プロトコルがウェルネス系メディアに届くころには、 promising は エクスプレッシブ・ライティングは免疫を強化する、 トラウマを処理する、うつを書き換える に変わっていた。四十年と 四つの本格的なメタ分析を経たいまの慎重な要約は、見出しよりも、 そして見出しを裏返した懐疑論よりも、狭く、そして面白い。
誰も引かない見出しの数字
日記研究で最もよく引用される単一の数字は、Smyth が 1998 年に 出した平均効果量 d = 0.47、十三件の無作為化試験、被験者 806 名を プールしたものだ。[6] ウェルネス系の書き手は これを「中程度の効果」と短く言い切って、そこで止まる。ほぼ誰も引かない のは、二つ目のメタ分析である。Frattaroli が 2006 年に行った ランダム効果モデルでのプーリングは、百四十六件の実験的開示研究、 被験者 10,994 名を集約し、全体の相関を r = .075、d 換算で約 0.151 と 報告した。[1] 研究数で四倍、被験者数で 十三倍、効果はおよそ三分の一。
有望なまぐれから定説へ
Pennebaker 1986 から Smyth 1998 に至る軌跡は、新しいパラダイムが たどる典型的な初期キャリアだ。一つの境界線上の交互作用を含む 小さな最初の研究が、それまで誰も問わなかった問いを開く。 短い書く課題で、健康のアウトカムを動かせるのか。八〇年代後半から 九〇年代にかけて、健康な学部生を対象に、つまらない話題の対照群を 置いてプロトコルが繰り返された。Smyth のプーリングでは、その うち十三件の試験が重み付けなしで d = 0.47 を示し、最大の効果は 生理機能(d = 0.68)と心理的ウェルビーイング(d = 0.66)で見られた。 [6] セッション数もセッション時間も効果を 調節せず、いずれも p > .10。数字は実在し、プロトコルは単純で、 感情について書くことは測定可能な健康効果を生む という主張は、 分野が適切に検証できるだけの研究をプールするより十年も早く、 定説として固まった。
縮小
それから文献は、文献がいつもすることをした。手法が改善された。 標本サイズが増えた。元のプロトコルが検証されていなかった集団や アウトカムにも対象が広がった。プールされた効果は圧縮された。
| study | |プール d 換算| |
|---|---|
| Smyth 1998 | 0.47 |
| Frattaroli 2006 | 0.15 |
| Frisina 2004 | 0.19 |
| Travagin 2015 | 0.13 |
| Reinhold 2018 | 0.03 |
最も同条件に近い比較は、図の中にある。Frattaroli の 2006 年の うつ特化バケットは r = .073、d 換算で約 0.15 を報告した。Reinhold らは十二年後、身体的に健康な成人のうつ症状を対象にした エクスプレッシブ・ライティングの三十九件の RCT について、多階層 メタ分析を行った。平均六か月のフォローアップ時点での長期効果は g = -0.03、九十五パーセント信頼区間 [-0.16、0.09] だった。 [5] 直後測定では小さな有意な効果 (書く側に有利な方向で g = -0.09)があったが、最初のフォローアップ までに消えた。トリム・アンド・フィルでは欠落研究はゼロと推定された。 初期の数字を膨らませた出版バイアスのアーティファクトはない。 健康な成人におけるうつ効果は、より厳密なプーリングのもとでは 長期フォローアップを生き延びなかったというだけだ。
見出しの数字が隠す不均一性
Frattaroli の全体 r = .075 は、個々のアウトカムを記述するには 貧しい数字だ。主観的インパクト評価、つまり書く体験についての 本人の事後評価は r = .159。報告された健康症状は r = .072。 生理機能は r = .060。心理的健康は r = .056。健康行動、つまり 喫煙が減ったか運動が増えたかを誰かが確認できる唯一のバケットは r = .007 で、十件の研究で有意水準に届かなかった。 [1] プロトコルが動かすのは、 測定可能な健康そのものよりも、書く課題に対する参加者の感じ方の ほうである。
Spending 20 min a day for 3 days on an independent writing activity producing an effect halfway between small and medium is, in this author's opinion, quite impressive.
このプロトコルについて行われた史上最大のメタ分析の著者は、最大の アウトカムバケットにおける最適条件下の効果を、小と中の中間 と 表現している。その大きさで読めば、文献はウェルネス系のスローガン でも、その却下でもない。
最近のメタ分析が除外した集団
Reinhold のうつに関する長期ヌル結果は、一見、清潔な反証に見える。 脚注がそれを複雑にする。2018 年のサンプルは、PTSD を持つ参加者を 明示的に除外し、身体疾患の研究も除外した。それらのサブグループは それ自体で一つの介入であり、セルフヘルプ型のデザインとはうまく プールできない、という原則的な理由による。 [5] そしてそのサブグループこそ、 Smyth と Frattaroli が最大の効果を報告していた場所だった。 トラウマ集団と身体疾患のサンプルである。縮小の一部は本物の 方法論的進歩であり、一部は元のシグナルが最も大きく鳴っていた サブグループを意図的に除外した結果である。
縮小は、丁寧に読めば、単一の物語ではない。問いの明確化である。 Smyth と Frattaroli は、分野が 1986 年以来研究してきた集団を そのままプールした。健康な学部生がトラウマについて書く。がん 患者が診断について書く。介護者、睡眠時無呼吸の患者、線維筋痛症の サンプル。プールされた d は、その混合コーパス全体の平均で何が 起こるかを記述しており、強い臨床サブグループが算術的な仕事を 担っている。Reinhold は標本を身体的に健康な成人に限定し、PTSD は それ自体で臨床的介入の問いとして扱い、より狭い現代版の問いを 立てた。短い自己主導の書く行為は、六か月後のフォローアップで、 非臨床の成人のうつに役立つか。答えはヌルだった。以前の答えは 小から中だった。両者は矛盾していない。両者は、異なるサンプルに ついての異なる問いへの答えであり、文献を正直に読むには、両方の 問いを視野に入れておく必要がある。
青少年の文献も同じ方向を指す。Travagin らは、十歳から十八歳の 若者を対象とした二十一件のエクスプレッシブ・ライティング研究を プールし、全体 g = 0.127 を見出した。最大のシグナルは、用量が 最も多く、書く話題が最も具体的な場合に出ている。 [7] Frisina の以前の臨床集団に関する メタ分析は d = 0.19 を報告し、計画された対比では身体的健康の アウトカム(d = 0.21)が心理的アウトカム(d = 0.07、非有意)を 上回った。[2] プールされた効果は、 分野が研究してきた集団を通じて小さく、最も確実に生き残るのは、 気分のシグナルではなく身体のシグナルのほうだ。
四十年を生き延びたもの
文献の認知的メカニズム側は、効果量よりもよく持ちこたえた。 Pennebaker の 1997 年の Psychological Science レビューは、書いて いる最中に言語が測定可能に変化することを報告した。because の ような因果語と understand のような洞察語の使用が増えていき、 独立した判定者が、まとまりの悪かった記述が最終日には一貫した 語りになっていくのを追跡した。[4] Pennebaker 自身の読みでは、効果を運んだのは、元のプロトコルが 組み立てられていたカタルシスではなく、経験を構造化された言語に 翻訳することのほうだった。そのメカニズムは、三十分のトラウマ・ プロトコルを必要としない。具体的な何かを、具体的な言葉に置こうと する試みを必要とする。
縮小によって 日記の科学のピラー が失う ものは、スローガンである。残るのは、Burton と King の二分間の 奇跡 が示した床の発見、 身体に対する小さくも持続的なシグナルを持つ免疫の枝、 そして Pennebaker が 1997 年に記述した認知的翻訳である。同じ縮小のパターンは感謝の文献にも現れる。統制の厳密さで並べた十二の RCT は、統制が厳しくなるにつれて効果が崩れていく様子を示している。これらの どれも d = 0.47 に依存していない。一つの具体的な文をページの上に 置くという行為に依存している。文献の四十年の弧は、本格的な メタ分析のもとでは必ず圧縮されるはずだった初期推定値の、ゆっくりと した修正である。実際の大きさで読めば、エクスプレッシブ・ライティング は、消え去らなかった心理学のいくつかの奇妙な小さい効果のひとつである。
参考文献。
- 1.Frattaroli, J. (2006). Experimental disclosure and its moderators: A meta-analysis. Psychological Bulletin 132(6), 823–865.doi:10.1037/0033-2909.132.6.823
- 2.Frisina, P.G. et al. (2004). A meta-analysis of the effects of written emotional disclosure on the health outcomes of clinical populations. Journal of Nervous and Mental Disease 192(9), 629–634.doi:10.1097/01.nmd.0000138317.30764.63
- 3.Pennebaker, J.W. & Beall, S.K. (1986). Confronting a traumatic event: Toward an understanding of inhibition and disease. Journal of Abnormal Psychology 95(3), 274–281.doi:10.1037/0021-843X.95.3.274
- 4.Pennebaker, J.W. (1997). Writing About Emotional Experiences as a Therapeutic Process. Psychological Science 8(3), 162-166.doi:10.1111/j.1467-9280.1997.tb00403.x
- 5.Reinhold, M. et al. (2018). Effects of expressive writing on depressive symptoms — A meta-analysis. Clinical Psychology: Science and Practice 25(1), e12224.doi:10.1111/cpsp.12224
- 6.Smyth, J.M. (1998). Written emotional expression: Effect sizes, outcome types, and moderating variables. Journal of Consulting and Clinical Psychology 66(1), 174–184.doi:10.1037/0022-006X.66.1.174
- 7.Travagin, G. et al. (2015). How effective are expressive writing interventions for adolescents? A meta-analytic review. Clinical Psychology Review 36, 42–55.doi:10.1016/j.cpr.2015.01.003