일기 쓰기의 과학
마흔 살이 된 페네베이커 효과
더 나은 방법론 아래에서 글쓰기 치료의 정전적 주장은 작아졌다. smyth부터 reinhold까지, 표현적 글쓰기 메타분석 사십 년을 정직하게 읽는다.
사십 년 전, Journal of Abnormal Psychology에 실린 작은 무작위 시험은 학부생 마흔여섯 명에게 나흘 연속 저녁마다 십오 분씩 개인적인 트라우마에 관해 글을 쓰게 했다. 여섯 달 뒤, 트라우마와 감정 조건의 학생들은 사소한 주제 통제군에 비해 캠퍼스 보건소를 대략 절반쯤만 찾았다. Pennebaker와 Beall은 이 결과를 두고 promising rather than definitive라 적었고, 그들이 직접 보고한 수치는 F(3, 42) = 2.74, p = .055였다. [3] 그 단서는 이후 사십 년을 버티지 못했다. 프로토콜이 웰니스 매체에 닿을 무렵 유망하다는 표현적 글쓰기는 면역을 강화한다, 트라우마를 처리한다, 우울을 다시 배선한다로 굳어 있었다. 사십 년과 진지한 메타분석 네 편이 지난 지금, 신중한 요약은 헤드라인보다도, 회의주의의 거울보다도 더 좁고 더 흥미롭다.
아무도 인용하지 않는 헤드라인 숫자
저널링 문헌에서 가장 많이 인용되는 단일 숫자는 1998년 Smyth의 평균 효과크기, 무작위 연구 열세 편과 참여자 806명을 합친 d = 0.47이다. [6] 웰니스 글쓴이들은 이를 중간 정도의 효과로 줄여 부르고 거기서 멈춘다. 거의 아무도 인용하지 않는 숫자는 두 번째 메타분석이다. 2006년 Frattaroli의 변량효과 통합 분석은 백마흔여섯 편의 실험적 자기개시 연구와 참여자 10,994명을 묶어 전체 상관 r = .075, d로 환산하면 약 0.151을 보고했다. [1] 연구 수는 네 배, 표본은 열세 배, 효과는 대략 삼분의 일이다.
유망한 우연에서 정전적 주장으로
Pennebaker 1986에서 Smyth 1998로 이어지는 곡선은 한 패러다임이 초창기에 그리는 표준 궤적이다. 작은 첫 연구가 경계선 상호작용 하나로 학계가 묻지 않던 질문을 연다. 짧은 글쓰기 과제 하나가 건강 결과를 조금이나마 움직일 수 있는가? 80년대 후반과 90년대를 거치며 이 프로토콜은 건강한 학부생들에게 사소한 주제 통제군과 함께 반복 수행되었다. Smyth의 통합 분석에 따르면 그중 열세 편의 시험이 가중되지 않은 d = 0.47을 냈고, 가장 큰 개별 묶음은 생리적 기능(d = 0.68)과 심리적 안녕(d = 0.66)에 있었다. [6] 회기 수도, 회기 길이도 효과를 조절하지 못했다. 둘 다 p > .10. 숫자는 진짜였고, 프로토콜은 단순했고, 감정에 관해 글을 쓰면 측정 가능한 건강 효과가 나타난다는 주장은 학계가 이를 제대로 검증할 만큼의 연구를 모으기 십 년 전에 정전적 형태로 굳어 버렸다.
위축
그 뒤 문헌은 문헌이 늘 하는 일을 했다. 방법은 좋아졌다. 표본은 커졌다. 원래 프로토콜이 검증된 적 없는 인구와 결과까지 풀이 넓어졌다. 통합된 효과는 압축되었다.
| study | |통합 d 환산값| |
|---|---|
| Smyth 1998 | 0.47 |
| Frattaroli 2006 | 0.15 |
| Frisina 2004 | 0.19 |
| Travagin 2015 | 0.13 |
| Reinhold 2018 | 0.03 |
가장 깔끔한 동등 비교는 차트 안에 들어 있다. Frattaroli의 2006년 우울 특화 묶음은 r = .073, d로는 약 0.15였다. 십이 년 뒤 Reinhold와 동료들은 신체적으로 건강한 성인의 우울 증상에 대한 표현적 글쓰기 RCT 서른아홉 편을 다층 메타분석으로 돌렸다. 평균 여섯 달 추적 시점의 장기 효과는 g = −0.03, 95% 신뢰구간 [−0.16, 0.09]이었다. [5] 즉시 사후검사에서의 작은 유의미한 효과(글쓰기에 유리한 방향으로 g = −0.09)는 첫 추적조사 시점에 사라졌다. trim-and-fill은 누락된 연구를 0편으로 추정했다. 초기 수치를 부풀리는 출판편향 인공물은 없다. 더 엄격한 통합 아래에서 건강한 성인의 우울 효과가 그저 장기 추적조사를 견디지 못했을 뿐이다.
헤드라인 숫자가 가리는 이질성
Frattaroli의 전체 r = .075는 어느 개별 결과에 대한 묘사로도 형편없다. 참여자가 글쓰기 경험을 스스로 회고적으로 평가한 주관적 영향 평가는 r = .159였다. 보고된 건강 증상은 r = .072. 생리적 기능은 r = .060. 심리적 건강은 r = .056. 누군가의 흡연이 줄었는지 운동이 늘었는지 확인할 수 있는 유일한 결과 묶음인 건강 행동은 r = .007이었고, 열 편의 연구를 가로질러 유의수준을 넘기지 못했다. [1] 프로토콜은 참여자가 자기 건강을 측정 가능하게 바꾸기보다, 그 글쓰기 경험에 갖는 느낌을 더 많이 움직인다.
Spending 20 min a day for 3 days on an independent writing activity producing an effect halfway between small and medium is, in this author's opinion, quite impressive.
이 프로토콜에 관해 지금까지 수행된 가장 큰 메타분석의 저자는, 가장 큰 결과 묶음에서 최적 조건일 때의 효과를 작은 것과 중간 것의 중간쯤이라고 묘사한다. 그 크기에서 읽으면, 문헌은 웰니스 구호도, 그것을 깎아내리는 반대편도 아니다.
최근 메타분석들이 제외한 인구
Reinhold의 우울에 대한 장기 영효과는 언뜻 깔끔한 반박처럼 보인다. 각주가 그 이야기를 복잡하게 만든다. 2018년 표본은 PTSD가 있는 참여자를 명시적으로 제외했고, 신체 질환에 관한 연구도 제외했다. 그런 하위집단은 그 자체로 별개의 개입이며 자기계발 양식의 설계와는 잘 통합되지 않는다는 원칙이 그 근거다. [5] 그런데 그 하위집단이 바로 Smyth와 Frattaroli가 가장 큰 효과를 보고했던 자리다. 트라우마 인구와 신체 질환 표본. 위축의 일부는 진짜 방법론적 진전이고, 일부는 원래 신호가 가장 크게 울렸던 하위집단을 의도적으로 제외한 결과다.
위축은 주의 깊게 읽으면 단일한 이야기가 아니다. 그것은 질문의 명료화다. Smyth와 Frattaroli는 1986년 이래 학계가 연구해 온 전체 코퍼스를 통합했다. 트라우마에 관해 쓰는 건강한 학부생들. 진단에 관해 쓰는 암 환자들. 돌봄제공자, 수면호흡장애 환자, 섬유근통 표본. 통합된 d는 그 혼합 코퍼스에서 평균적으로 일어나는 일을 묘사하며, 산술적 무게는 임상 하위집단들이 떠받친다. Reinhold는 표본을 신체적으로 건강한 성인으로 제한하고, PTSD를 독립된 임상적 개입 문제로 다루었으며, 더 좁은 동시대 버전의 질문을 던졌다. 짧은 자기주도적 글쓰기는 임상 진단이 없는 성인의 우울에 여섯 달 추적 시점에 도움이 되는가? 답은 영효과였다. 앞선 답은 작은 것에서 중간 정도였다. 둘은 모순이 아니다. 둘은 서로 다른 표본에 대한 서로 다른 질문에 대한 답이며, 이 문헌을 정직하게 읽으려면 두 질문을 모두 시야에 두어야 한다.
청소년 문헌도 같은 방향을 가리킨다. Travagin과 동료들은 열에서 열여덟 살 청소년 대상 표현적 글쓰기 연구 스물한 편을 통합해 전체 g = 0.127을 얻었고, 신호는 용량이 가장 높고 글쓰기 주제가 가장 구체적인 곳에서 가장 컸다. [7] 그보다 앞선 Frisina의 임상 인구 메타분석은 d = 0.19를 보고했고, 사전 계획된 대조에서 신체 건강 결과(d = 0.21)가 심리 결과(d = 0.07, 비유의)를 앞섰다. [2] 학계가 연구해 온 인구 전반에서 통합된 효과는 작고, 가장 안정적으로 살아남는 것은 기분이 아니라 신체 쪽 신호다.
사십 년을 살아남은 것
문헌의 인지 기제 쪽은 효과크기보다 더 잘 버텼다. Pennebaker의 1997년 Psychological Science 리뷰는 글쓰기 동안 언어에서 측정 가능한 변화가 일어난다고 보고했다. because 같은 인과어와 understand 같은 통찰어의 사용이 늘었고, 독립된 평가자들은 조잡하게 조직된 묘사가 마지막 날에는 일관된 서사로 바뀌는 것을 보았다. [4] Pennebaker 자신이 읽기로, 효과를 떠받친 것은 원래 프로토콜이 둘러싸고 지어졌던 카타르시스가 아니라 경험을 구조화된 언어로 옮기는 번역이었다. 그 기제는 삼십 분짜리 트라우마 프로토콜을 요구하지 않는다. 구체적이고 특정한 한 가지를 구체적이고 특정한 말로 옮기려는 시도를 요구한다.
저널링 과학 기둥이 위축과 함께 잃는 것은 구호다. 남는 것은 Burton과 King의 두 분 기적이 보여 준 바닥선 발견, 몸 위에 작지만 끈질긴 신호를 남기는 면역 가지, 그리고 Pennebaker가 1997년에 묘사한 인지적 번역이다. 같은 위축 양상은 감사 문헌에서도 나타나며, 통제 엄격도 순으로 정렬한 열두 편의 RCT는 통제가 단단해질수록 효과가 무너지는 모습을 보여 준다. 그 어느 것도 d = 0.47에 기대지 않는다. 그것들은 한 문장을 종이 위에 구체적으로 올려놓는 행위에 기댄다. 사십 년에 걸친 이 문헌의 곡선은 진지한 메타분석 아래에서는 결국 압축될 수밖에 없었던 초기 추정의 더딘 교정이다. 실제 크기로 읽으면, 표현적 글쓰기는 사라지지 않은, 심리학에서 더 기이한 작은 효과 가운데 하나다.
참고문헌.
- 1.Frattaroli, J. (2006). Experimental disclosure and its moderators: A meta-analysis. Psychological Bulletin 132(6), 823–865.doi:10.1037/0033-2909.132.6.823
- 2.Frisina, P.G. et al. (2004). A meta-analysis of the effects of written emotional disclosure on the health outcomes of clinical populations. Journal of Nervous and Mental Disease 192(9), 629–634.doi:10.1097/01.nmd.0000138317.30764.63
- 3.Pennebaker, J.W. & Beall, S.K. (1986). Confronting a traumatic event: Toward an understanding of inhibition and disease. Journal of Abnormal Psychology 95(3), 274–281.doi:10.1037/0021-843X.95.3.274
- 4.Pennebaker, J.W. (1997). Writing About Emotional Experiences as a Therapeutic Process. Psychological Science 8(3), 162-166.doi:10.1111/j.1467-9280.1997.tb00403.x
- 5.Reinhold, M. et al. (2018). Effects of expressive writing on depressive symptoms — A meta-analysis. Clinical Psychology: Science and Practice 25(1), e12224.doi:10.1111/cpsp.12224
- 6.Smyth, J.M. (1998). Written emotional expression: Effect sizes, outcome types, and moderating variables. Journal of Consulting and Clinical Psychology 66(1), 174–184.doi:10.1037/0022-006X.66.1.174
- 7.Travagin, G. et al. (2015). How effective are expressive writing interventions for adolescents? A meta-analytic review. Clinical Psychology Review 36, 42–55.doi:10.1016/j.cpr.2015.01.003