la science du journal
l'effet pennebaker à quarante ans
la promesse canonique de l'écriture expressive a rétréci avec de meilleures méthodes. une lecture honnête de quarante ans de méta-analyses.
Il y a quarante ans, un petit essai randomisé du Journal of Abnormal Psychology demandait à quarante-six étudiants d'écrire sur un traumatisme personnel pendant quinze minutes, quatre soirs de suite. Six mois plus tard, les étudiants de la condition trauma-et-émotions avaient consulté le centre de santé du campus environ deux fois moins souvent que les contrôles affectés à un sujet trivial. Pennebaker et Beall qualifièrent le résultat de promising rather than definitive, F(3, 42) = 2,74, p = 0,055 selon leur propre rapport. [3] Le qualificatif n'a pas survécu aux quatre décennies suivantes. Au moment où le protocole a atteint la presse bien-être, prometteur était devenu l'écriture expressive renforce ton système immunitaire, traite le traumatisme, recâble la dépression. Quarante ans et quatre méta-analyses sérieuses plus tard, le résumé prudent est plus étroit et plus intéressant que le titre racoleur ou son miroir sceptique.
le chiffre vedette que personne ne cite
Le seul chiffre le plus cité de la littérature sur le journal intime est la taille d'effet moyenne de Smyth en 1998, d = 0,47, agrégée sur treize études randomisées et 806 participants. [6] Les auteurs bien-être abrègent cela en effet moyen et s'arrêtent là. Le chiffre que presque personne ne cite est la deuxième méta-analyse. L'agrégation à effets aléatoires de Frattaroli en 2006, portant sur cent quarante-six études expérimentales de divulgation et 10 994 participants, rapportait une corrélation globale de r = 0,075, équivalente à d ≈ 0,151. [1] Quatre fois plus d'études, treize fois plus de participants, environ un tiers de l'effet.
d'un hasard prometteur à une affirmation canonique
L'arc qui va de Pennebaker 1986 à Smyth 1998 est la trajectoire classique de début de carrière d'un paradigme. Une petite première étude avec une interaction limite ouvre une question que le domaine ne s'était pas posée. Une brève consigne d'écriture peut-elle déplacer un résultat de santé ? À la fin des années quatre-vingt et dans les années quatre-vingt-dix, le protocole a été répété face à des contrôles à sujet trivial chez des étudiants en bonne santé. Selon l'agrégation de Smyth, treize de ces essais ont produit un d non pondéré de 0,47, avec les plus gros groupes individuels en fonctionnement physiologique (d = 0,68) et en bien-être psychologique (d = 0,66). [6] Ni le nombre de séances ni leur durée ne modéraient l'effet, les deux p > 0,10. Le chiffre était réel, le protocole était simple, et l'affirmation selon laquelle écrire sur l'émotion produit des effets de santé mesurables s'est durcie en version canonique une décennie avant que le domaine n'ait agrégé assez d'études pour la tester correctement.
le rétrécissement
Puis la littérature a fait ce que font les littératures. Les méthodes se sont améliorées. Les échantillons ont grossi. Le corpus s'est élargi à des populations et à des résultats pour lesquels le protocole d'origine n'avait pas été validé. L'effet agrégé s'est compressé.
| study | |d-équivalent agrégé| |
|---|---|
| Smyth 1998 | 0.47 |
| Frattaroli 2006 | 0.15 |
| Frisina 2004 | 0.19 |
| Travagin 2015 | 0.13 |
| Reinhold 2018 | 0.03 |
La comparaison la plus propre, équivalent contre équivalent, se trouve à l'intérieur du graphique. Le sous-groupe spécifique à la dépression de Frattaroli en 2006 rapportait r = 0,073, soit d ≈ 0,15. Reinhold et ses collègues, douze ans plus tard, ont mené une méta-analyse multiniveau sur trente-neuf ECR d'écriture expressive sur les symptômes dépressifs chez des adultes en bonne santé physique. L'effet à long terme, à un suivi moyen de six mois, était de g = −0,03, intervalle de confiance à 95 % [−0,16, 0,09]. [5] Un petit effet significatif au post-test immédiat (g = −0,09 dans le sens favorisant l'écriture) s'estompait dès le premier suivi. Le trim-and-fill estimait zéro étude manquante. Aucun artefact de biais de publication ne gonfle les premiers chiffres ; l'effet sur la dépression chez l'adulte en bonne santé n'a tout simplement pas survécu au suivi à long terme sous une agrégation plus stricte.
l'hétérogénéité que le chiffre vedette dissimule
Le r global de 0,075 de Frattaroli est une mauvaise description de n'importe quel résultat individuel. Les évaluations subjectives d'impact, le jugement rétrospectif du participant lui-même sur l'expérience d'écriture, atteignaient r = 0,159. Les symptômes de santé rapportés étaient à r = 0,072. Le fonctionnement physiologique à r = 0,060. La santé psychologique à r = 0,056. Les comportements de santé, le seul groupe de résultats où l'on peut vérifier si quelqu'un a moins fumé ou fait plus d'exercice, atteignaient r = 0,007 et n'ont pas franchi le seuil de significativité sur dix études. [1] Le protocole déplace davantage la manière dont les participants se sentent à propos de l'exercice d'écriture que leur santé mesurable.
Spending 20 min a day for 3 days on an independent writing activity producing an effect halfway between small and medium is, in this author's opinion, quite impressive.
L'auteure de la plus grande méta-analyse jamais menée sur le protocole décrit l'effet comme à mi-chemin entre petit et moyen dans des conditions optimales sur le plus grand de ses groupes de résultats. Lue à cette taille, la littérature n'est ni le slogan bien-être ni le rejet pur et simple.
la population que les méta-analyses récentes ont exclue
Le résultat nul à long terme de Reinhold sur la dépression ressemble à première vue à une réfutation propre. La note de bas de page complique l'affaire. L'échantillon de 2018 excluait explicitement les participants atteints de TSPT et excluait les études sur la maladie physique, au motif de principe que ces sous-groupes constituent eux-mêmes des interventions à part entière et s'agrègent mal avec les protocoles d'auto-assistance. [5] Or ces sous-groupes se trouvent être exactement ceux où Smyth et Frattaroli rapportaient leurs plus gros effets. Populations traumatisées et échantillons souffrant de maladie somatique. Une partie du rétrécissement relève d'un vrai progrès méthodologique, et une autre partie relève de l'exclusion délibérée des sous-groupes où le signal d'origine résonnait le plus fort.
Le rétrécissement, lu attentivement, n'est pas une histoire unique. C'est une clarification de la question. Smyth et Frattaroli ont agrégé l'ensemble du corpus que le domaine étudiait depuis 1986. Étudiants en bonne santé écrivant sur un traumatisme. Patients atteints de cancer écrivant sur leur diagnostic. Aidants, personnes souffrant de troubles respiratoires du sommeil, échantillons fibromyalgiques. Le d agrégé décrit ce qui se passe en moyenne sur ce corpus mixte, avec les sous-groupes cliniques les plus lourds qui font le travail arithmétique. Reinhold a restreint l'échantillon aux adultes en bonne santé physique, a traité le TSPT comme une question d'intervention clinique à part entière, et a posé la version contemporaine plus étroite. Une brève écriture autodirigée aide-t-elle des adultes non cliniques souffrant de dépression à un suivi de six mois ? La réponse était nulle. La réponse antérieure était petite à moyenne. Les deux ne sont pas en contradiction. Ce sont des réponses à des questions différentes sur des échantillons différents, et la lecture honnête de la littérature doit garder les deux questions en vue.
La littérature sur les adolescents pointe dans le même sens. Travagin et ses collègues ont agrégé vingt et une études d'écriture expressive chez les jeunes de dix à dix-huit ans et ont trouvé un g global de 0,127, le signal le plus fort se manifestant là où la posologie était la plus élevée et le sujet d'écriture le plus spécifique. [7] La méta-analyse antérieure de Frisina sur des populations cliniques rapportait d = 0,19, avec un contraste planifié montrant que les résultats de santé physique (d = 0,21) devançaient les résultats psychologiques (d = 0,07, non significatif). [2] L'effet agrégé est petit dans les populations que le domaine a étudiées, et ce qui survit le plus fiablement est le signal somatique plutôt que le signal de l'humeur.
ce qui a survécu à quarante ans
Le versant cognitif de la littérature, celui des mécanismes, a mieux tenu que les tailles d'effet. La revue de Pennebaker en 1997 dans Psychological Science rapportait un déplacement mesurable du langage pendant l'écriture, un usage croissant de mots de causalité comme parce que et de mots d'introspection comme comprendre, suivi par des juges indépendants qui voyaient des descriptions mal organisées devenir des récits cohérents au dernier jour. [4] Ce qui portait l'effet, dans la lecture qu'en faisait Pennebaker lui-même, était la traduction de l'expérience en langage structuré, plutôt que la catharsis autour de laquelle le protocole d'origine avait été construit. Ce mécanisme n'exige pas un protocole de trauma de trente minutes. Il exige une tentative de mettre une chose spécifique et concrète en mots spécifiques et concrets.
Ce que le pilier de la science du journal perd avec le rétrécissement, c'est le slogan. Ce qu'il garde, c'est la trouvaille plancher du two-minute miracle de Burton et King, la branche immunitaire avec son signal petit mais persistant sur le corps, et la traduction cognitive que Pennebaker décrivait en 1997. Le même schéma de rétrécissement réapparaît dans la littérature sur la gratitude, où les douze ECR classés par rigueur des contrôles montrent l'effet qui s'effondre à mesure que les contrôles se resserrent. Aucun de ces éléments ne dépend de d = 0,47. Ils dépendent de l'acte de poser une phrase spécifique sur une page. L'arc de quarante ans de la littérature est la lente correction d'une estimation précoce qui allait forcément se compresser sous une méta-analyse sérieuse. Lue à la taille qu'elle a réellement, l'écriture expressive est l'un des petits effets les plus singuliers de la psychologie qui n'aient pas disparu.
références.
- 1.Frattaroli, J. (2006). Experimental disclosure and its moderators: A meta-analysis. Psychological Bulletin 132(6), 823–865.doi:10.1037/0033-2909.132.6.823
- 2.Frisina, P.G. et al. (2004). A meta-analysis of the effects of written emotional disclosure on the health outcomes of clinical populations. Journal of Nervous and Mental Disease 192(9), 629–634.doi:10.1097/01.nmd.0000138317.30764.63
- 3.Pennebaker, J.W. & Beall, S.K. (1986). Confronting a traumatic event: Toward an understanding of inhibition and disease. Journal of Abnormal Psychology 95(3), 274–281.doi:10.1037/0021-843X.95.3.274
- 4.Pennebaker, J.W. (1997). Writing About Emotional Experiences as a Therapeutic Process. Psychological Science 8(3), 162-166.doi:10.1111/j.1467-9280.1997.tb00403.x
- 5.Reinhold, M. et al. (2018). Effects of expressive writing on depressive symptoms — A meta-analysis. Clinical Psychology: Science and Practice 25(1), e12224.doi:10.1111/cpsp.12224
- 6.Smyth, J.M. (1998). Written emotional expression: Effect sizes, outcome types, and moderating variables. Journal of Consulting and Clinical Psychology 66(1), 174–184.doi:10.1037/0022-006X.66.1.174
- 7.Travagin, G. et al. (2015). How effective are expressive writing interventions for adolescents? A meta-analytic review. Clinical Psychology Review 36, 42–55.doi:10.1016/j.cpr.2015.01.003
à lire ensuite.
- meilleur moment pour tenir un journal, il n'y a pas d'ECRaucun essai direct ne tranche matin contre soir. quatre lignes de preuves indirectes, chronobiologie, sommeil, inquiétude, penchent du même côté.
- la branche oubliée. journal et fonction immunitairela découverte la plus surprenante de Pennebaker n'était pas psychologique. elle était immunologique. la branche oubliée, lue honnêtement.
- le piège de la ruminationquand le journal se retourne contre nous. quatre signes d'attention sur soi bloquée, et ce que fait l'écriture structurée à la place.