[Avent 2024 – Ecrire sa thèse] – 14/24 – Etudes quantitatives, grands principes

Après un point de vue général sur le qualitatif, faisons de même sur le quantitatif avec le même plan. Là encore, vous allez : choisir un type d’étude (selon votre objectif) – puis recueillir des données – puis les analyser.

Choisir le type d’étude

En qualitatif, vous pouvez étudier le vécu d’un individu face à un phénomène (approche par analyse interprétative phénoménologique – souvent abrégé en phénoménologie), étudier les réactions et comportements d’individus autour d’un phénomène (approche par théorisation ancrée), étudier les dynamiques de groupe face à un phénomène (ethnographie)… ou autres méthodes que nous avons peu détaillées.

En quantitatif, en reprenant le terme de phénomène (qu’on pourrait plutôt remplacer par « variable »), vous pouvez :

  • étudier la survenue d’un phénomène (une maladie, une habitude médicamenteuse, une fréquence d’effets indésirables…) par des études épidémiologiques descriptives
  • étudier l’association entre deux phénomènes (tabagisme et revenu socio-économique ; tabagisme et cancer du poumon, etc.) par des études épidémiologiques analytiques
  • étudier les valeurs diagnostiques d’un test, par des études diagnostiques
  • étudier l’efficacité et la tolérance d’un traitement par des études thérapeutiques

Comme pour la partie qualitative, nous resterons focalisés sur ces grands types d’études. Il en existe d’autres, notamment les études médico-économiques (coût-efficacité, coût-utilité…) ou les modélisations mathématiques. Une liste est disponible ici.

Pour reprendre l’exemple de la poule avec un couteau… La phénoménologie nous avait appris le ressenti et le vécu d’une poule face à un tel ustensile ; la théorisation ancrée nous avait permis de construire un modèle du couteau selon les poules ; l’ethnographie nous avait fait étudier la dynamique d’un groupe de poules face à un couteau.
Cette fois :

  • l’étude épidémiologie descriptive va calculer le nombre de couteaux par poulailler (prévalence), éventuellement par an (incidence) ;
  • l’étude épidémiologie analytique va déterminer si le nombre (ou la forme) des couteaux varie en fonction de la taille, la localisation régionale, la densité de pop(o)ulation autour de la ferme ;
  • l’étude diagnostique va nous permettre de déterminer la sensibilité et la spécificité des caméras à infrarouges dans le poulailler pour repérer le couteau ;
  • l’étude thérapeutique va étudier l’efficacité et la tolérance d’un gilet pare-couteau chez les poules

Recueillir des données : modalités de recueil et modalités d’échantillonnage

Le recueil de données vise idéalement à l’exhaustivité… ou à défaut, à la constitution d’un échantillon représentatif de la cible.
Par exemple, si vous voulez connaître la moyenne en mathématiques de la classe de 6ème 4 du collège Albert Camus de votre ville, l’exhaustivité est possible ; si vous voulez connaître la moyenne en mathématiques des 6ème en France, vous allez peut-être devoir constituer un échantillon (ou profiter des grandes bases de données).

ll existe plusieurs méthodes de recueil :

  • Observations avec mesures directes : collecte d’informations mesurables sur le terrain (clinique, biologique, radiologique, éventuellement avec des outils connectés…)
  • Bases de données existantes : réutilisation de données ; pour vous donner une idée de ce qu’il y a dans le SNDS : https://health-data-hub.shinyapps.io/dico-snds/
  • Questionnaire (standardisés idéalement) : en papier, en ligne ; souvent structuré, parfois avec des commentaires libres ;
  • Expérimentation contrôlée

Concernant l’échantillonnage, il pourra être idéalement probabiliste :

  • aléatoire (sélection aléatoire)
  • systématique (sélection selon un ordre décidé : par exemple le premier patient de chaque jour)
  • stratifié (sélection aléatoire dans des sous-groupes/strates homogènes selon une caractéristique)
  • en grappe (sélection aléatoire de sous-groupes organisationnels ou géographiques)

Un échantillonnage non probabiliste est possible, mais moins puissant car plus soumis à des biais de sélection notamment :

  • par convenance (les plus accessibles)
  • intentionnel / par jugement (ceux qui semblent pertinent selon le chercheur)
  • par quotas (celle des sondages : on a des quotas en sexe, âge, profession… et on remplit)
  • par effet boule de neige (idem en qualitatif : utile pour des populations rares)

Quand s’arrêter ?

Le nombre de sujets nécessaires doit être calculé a priori. Vous pouvez retrouver les informations sur le site Objectif Thèse d’Emmanuel Chazard.

Logiciels d’analyse

Il existe plusieurs outils et logiciels d’analyse :

Analyse des données

Le travail va se baser en 3 temps : transcrire – décrire (coder) – analyser (organiser)

Transcrire

Vous devez vérifier la qualité de vos données.

Pour cela, le plus simple est de tout regarder visuellement, en décrivant les variables une à une, par exemple en boîte à moustache (boxplot) : ça vous permettra de supprimer / corriger les données du patient de 451 ans, celui qui mesure 1180 cm, pèse 4 kg, etc. Ca vous permettra aussi d’homogénéiser s’il y a un patient qui prend du « paracétamol » avec celui qui prend du « paracetamol » ou celui qui prend du « paracétamol  » (avec 3 espaces après).

Il est aussi pertinent de préciser ce que vous ferez des données manquantes :

  • suppression (le plus courant) ;
  • imputation (remplacer par de « fausses » données probables…) : c’est un outil purement statistique, qui peut être discutable. Il faut surtout savoir que ça existe, mais c’est rare pour une thèse de médecine.

Décrire

Quel que soit votre type d’étude, la description (Tableau 1) est indispensable. C’est l’analyse univariée : vous décrivez une variable à la fois.
Les méthodes sont variées :

  • Moyenne et écart-type (mesure de dispersion)
  • Médiane et intervalle interquartiles
  • Nombre (%)

Les mesures de dispersion peuvent aussi être des intervalles de confiance à 95 % si la variable suite une loi normale.

Je l’ai déjà dit et je le répéterai : un tableau 1 c’est super, ça permet de synthétiser énormément d’informations en peu de pages (des heures de travail en un seul petit tableau : frustrant peut-être, magique assurément). Un tableau vaut 10 ou 20 graphiques lorsqu’il s’agit de décrire des variables (un graphique peut parfois être pertinent pour ça… mais c’est rare qu’il fasse mieux que le tableau !)

Analyser

Ensuite, vous pouvez procéder aux autres analyses. C’est là où vous verrez des petits p… il n’y en a pas en univarié et descriptif seul.

En pratique, on pose en général l’hypothèse nulle ou standard H0 : « il n’y a pas d’interaction entre les variables ». Cette hypothèse va être testée avec des… tests statistiques, pour rejeter (ou non) l’hypothèse au seuil alpha de 5 % (donc « avec 5 % de risque de nous tromper, nous affirmons qu’il existe une interaction / une différence statistiquement significative entre les 2 groupes »).
C’est ce qu’on appelle la démarche hypothético-déductive (qui est aussi celle que vous utilisez auprès de vos patients : vous formulez des hypothèses diagnostiques à l’interrogatoire, vous testez à l’examen physique, vous déduisez que leur probabilité diminue/augmente en conséquence, et vous formulez donc une conclusion… qui est parfois fausse).

Il y a 2 grands types d’analyse :

  • bivariées : est-ce que la variable X influence/explique/est associée à la variable Y ?
  • multivariées : c’est la même chose, sauf que la variable à expliquer Y peut l’être maintenant par plusieurs variables, afin de limiter les biais de confusion.

Vous avez plusieurs tests existants selon la nature des variables (continu, binaire, etc.) : test t de Student, ANOVA, Chi2, régression linéaire, régression logistique, etc.

Si vous vous lancez dans une étude quantitative, vous pouvez lire la page de LEPCAM ou Objectif Thèse.

Loading spinner

[Avent 2024 – Ecrire sa thèse] – 13/24 – Etudes qualitatives, grands principes

En 3 billets, je vais dresser des généralités sur les études qualitatives, les études quantitatives, les revues de littérature et méta-analyses. Il existe des guides bien plus détaillés pour les trois (déjà cités dans les précédents billets) : il s’agit plutôt ici de présenter de grands tableaux, qui pourront guider dans le choix de réaliser sa thèse dans tel ou tel sujet.

Nous allons nous baser sur le plan proposé dans le billet du 6, où il est rappelé que la méthode est la recette de cuisine, pour quelqu’un qui veut reproduire les résultats.

Concrètement, dans tous les cas, vous allez : choisir un type d’étude (selon votre objectif) – puis recueillir des données – puis les analyser.

Choisir le type d’étude (ou l’approche)

En quantitatif (mieux connu avec la lecture critique d’articles notamment), nous avons des études épidémiologiques (descriptive ou analytique), diagnostiques, thérapeutiques. Vous recueillez des données chiffrées : l’objectif guidera l’analyse et les résultats que vous présenterez.

En qualitatif, c’est le même principe… mais avec des données textuelles.

Les principales études possibles sont les approches par :

  • analyse interprétative phénoménologique (Interpretative Phenomenological Analysis ou IPA) : on se concentre sur l’individu, son vécu, son expérience (subjective) face à un phénomène
  • théorisation ancrée (Grounded Theory Method ou GTM, construire la théorie à partir des données) : on étudie le phénomène partagé, en analysant comment il se construit à travers les récits et comportements des individus
  • ethnographie : on étudie le groupe dans son environnement en observant comment il vit, interagit et s’approprie un phénomène.

Tout ça peut sembler abstrait et vous voici comme une poule avec un couteau (comme dit l’expression). Justement, étudions cette situation, et posons-nous (enfin) les bonnes questions :

  • Comment chaque poule (P) interprète et se sent (I) face à l’arrivée d’un couteau (Co) ? (on étudie le vécu, le ressenti, l’expérience de l’individu face à un phénomène : c’est de l’approche par phénoménologie IPA)
  • Comment les poules (P) réagissent (I) face à l’arrivée d’un couteau (Co) ? (on étudie les (ré)actions, les comportements face à un phénomène : c’est de l’approche par théorisation ancrée GTM)
  • Comment le groupe de poules (P) intègre le couteau (I) dans leurs pratiques collectives (Co) ? (on étudie les dynamiques de groupe : c’est de l’ethnographie)

Pour essayer de bien saisir, voici 2 autres images :

  • en littérature :
    • la phénoménologie pourrait se rapprocher du journal intime ;
    • la théorisation ancrée du polar ou thriller (où un scénario/une théorie s’élabore progressivement, pouvant être réel ou non, et surtout variable selon le point de vue) ;
    • l’ethnographie d’une enquête-documentaire dans une tribu (au sens large, la tribu pouvant être « les médecins généralistes trentenaires exerçant en libéral »)
  • ou plutôt qu’une poule avec un couteau, un enfant avec un puzzle :
    • la phénoménologie, c’est demander à l’enfant comment il vit la pièce du puzzle (sa forme, son toucher, son poids, son odeur, sa chaleur, ce que ça évoque, etc.)
    • la théorisation ancrée, c’est demander aux enfants d’associer les pièces les une avec les autres (sans suivre de modèle pré-établi) (on voit ici qu’un autre groupe, d’adultes par exemple, n’aurait pas la même image finale… changer de groupe c’est déjà être original !)
    • l’ethnographie, c’est regarder un groupe d’enfants interagir avec un puzzle (qui ouvre la boîte, propose de chercher les coins, cherche les bords d’abord, commence par le milieu, par motifs, par couleurs…)

Maintenant, si on détaille un peu davantage, les différentes approches :

  • théorisation ancrée : Construire un modèle explicatif (ou théorie) d’un phénomène ou d’interactions sociales, fondé (ou ancré) sur les données recueillies dans une population
    • Exemple : comment un processus social (I) est-il construit à partir des représentations (Co) de la population (P) ?
  • analyse interprétative phénoménologique : explorer en détail les habitudes ou comportements sur des individus
    • Exemple : comment les individus (P) perçoivent, ressentent, interprètent (I) un phénomène donné (Co) ?
  • ethnographie : s’immerger pour observer et analyser les habitudes de vie et les interactions d’un groupe
    • Exemple : comment le groupe (P) vit et structure ses interactions (I) autour d’un phénomène donné (Co) ?

Notez que la théorisation ancrée et l’analyse interprétative phénoménologique sont des études longues de sociologie ; pour une thèse de médecine, on utilisera plus modestement les termes « d’approche (inspirée) par théorisation ancrée » et « d’approche par analyse interprétative phénoménologique ».

Pour plus de détails, vous pouvez revoir le site LEPCAM ou le livre de Jean-Pierre Lebeau déjà cité.

Pour mémoire, il existe d’autres approches possibles en sociologie (dont certaines sont détaillées ici par exemple) :

  • étude de cas (étudier une ferme où une poule a trouvé un couteau pour comprendre ce phénomène rare)
  • bibliographie / approche narrative (demander à chaque poule de raconter son expérience, puis analyser pour comprendre comment elles donnent du sens à leur réalité)
  • observation participante (vivre au milieu des poules pour comprendre l’interaction avec le couteau – une des méthode de l’ethnographie)
  • analyse de discours (étudier comment le discours du fermier influence la perception des poules face au couteau)
  • analyse conversationnelle (observer comment les poules discutent entre elles lorsqu’elles ont découvert un couteau)
  • analyse de contenus (analyser les traces laissées par les poules autour du contenu ou sur les réseaux sociaux)
  • consensus structuré (demander aux poules expertes en couteau la conduite à tenir, et faire plusieurs tours pour dégager un consensus – par méthode Delphi).
  • etc.

Recueillir des données : modalités de recueil et modalités d’échantillonnage

Le recueil de données est différent en quantitatif et en qualitatif. Pour marquer un peu les esprits, disons :

  • en quantitatif, on cherche plutôt à avoir le minimum de variabilité avec le maximum d’individus (représentativité)
  • en qualitatif, on cherche plutôt à avoir le maximum de variabilité (informations) avec le minimum d’individu

Si on étudie les finishers d’un marathon, on sera embêté en quantitatif si sur 100 personnes, on a un sportif avec 2 prothèses de hanche qui termine en 3 heures, parce qu’il n’est pas représentatif de la population générale des marathoniens… alors qu’on sera ravi d’avoir son avis (sans doute) différent et nouveau s’il fait partie des 10 personnes interrogées en qualitatif !

ll existe plusieurs méthodes de recueil :

  • Observation : directe participante ou non (sur le terrain), indirecte (par analyse de transcriptions ou documentaire), par vidéo ;
  • Entretiens individuels : libres (sans guide prédéfini), semi-structurés (avec des thèmes), structurés (questions précises), approfondis (une ou deux questions très détaillées) ;
  • Entretiens en groupe : focus group (où les interactions entre participants permettent d’enrichir les données) ;
  • Méthode de consensus : groupe nominal (groupe réuni), méthode Delphi (groupe qui ne se réunit jamais)
  • Méthode de la pensée à voix haute, méthode des scénarios…

Le détail de la réalisation de ces méthodes pourra être retrouvé ailleurs.

Concernant l’échantillonnage, il pourra être :

  • raisonné (intentionnel) : choisir des poules qui ont vu un couteau
  • théorique (lié à la théorisation ancrée) : sélectionner les poules qui complètent les concepts émergents dans la théorie (celle qui a osé déplacer le couteau, etc.)
  • par variation maximale (maximiser les points de vue) : choisir des poules d’âge extrêmes pour comprendre leurs visions
  • par effet boule de neige (snowball sampling) : la première poule qui a vu un couteau nous oriente vers d’autres qui ont été dans la même situation

Ces modalités d’échantillonnage ne sont pas exclusive : on peut combiner un échantillonnage raisonné et une variation maximale.

Quand s’arrêter ?

L’idée est de poursuivre jusqu’à saturation (suffisance) des données : interroger des poules jusqu’à ce que x (souvent 2 consécutives) n’apportent plus de nouvelles informations par rapport à celles déjà recueillies

Notons ici qu’on parle de « suffisance » des données plutôt que saturation, qui est un concept de sociologie qui implique une triangulation lourde et chronophage, rarement réalisée pour une thèse de médecine générale.

Analyse des données

En qualitatif, vous pouvez utiliser le logiciel NVivo . En tapant « tutoriel » OU « didacticiel » ET NVIVO, vous trouverez facilement (on révise ici les booléens !). Par exemple, vous avez des capsules vidéo d’autoformation à NVivo par le Pre Sabrina Tremblay de l’Université du Québec à Chicoutimi.
Il existe des alternatives gratuites : Taguette, QualCoder, QDA Miner, RQDA, etc. Là encore, c’est à voir en amont avec votre directeur de thèse et ses habitudes…

Le travail va se baser en 3 temps : transcrire – décrire (coder) – analyser (organiser)

Transcrire

Auparavant (dans les années 2010 encore !) les verbatims étaient transcrits à la main, depuis un enregistrement audio et/ou vidéo. Désormais, beaucoup passent par des logiciels de reconnaissance vocale performants pour gagner un temps précieux !

Avant toute analyse, les données doivent être vérifiées et leur qualité optimisée (quand en quantitatif). Ici, cela passe par la triangulation (ce qui évoque juste triangle) :

  • théorique : avec un codage indépendant par plusieurs experts de cadres disciplinaires variés (psychologie, sciences de la gestion, sociologie) ;
  • des données (ou des outils de cueillette, ou des méthodes) : utiliser au moins 2 outils (entretiens, observations, analyse documentaire)
  • des chercheurs et chercheuses : plusieurs chercheurs qui apportent un point de vue (sur les concepts, etc.)
  • des sources : les données sont recueillies auprès de plusieurs sources différentes.
  • écologique (ou indéfinie) : renvoie aux analyses et aux interprétations qui sont soumises à la vérification auprès des sujets participant à la recherche.

Coder (décrire)

Des thèmes ou concepts émergent des données via une phase de codage, souvent inductive (inverse de déductif).

Organiser (analyser)

Ces thèmes ou concepts sont ensuite regroupés ou reliés pour dégager du sens.

Ce qui est change est :

  • la finalité de l’analyse :
    • vécu individuel dans la phénoménologie, sans chercher à généraliser (un modèle est possible mais non systématique) ;
    • théorie généralisable dans la théorie ancrée (le modèle est systématique) ;
    • pratiques culturelles et interactions sociales en ethnographie, sans forcément chercher à théoriser (un modèle est possible mais non systématique) ;
  • le niveau d’abstraction des concepts :
    • proches du vécu, des sentiments subjectifs en phénoménologie
    • modèle explicatif systématique en théorie ancrée
    • pratiques sociales ou culturelles en etnhographie

Pour finir sur mes exemples de poules et de couteau :

  • en théorie ancrée : l’analyse suit un processus inductif les données sont codées au fur et à mesure pour faire émerger des concepts (l’appellation « ancrée » ou « grounded theory model » désigne bien le fait que la théorie naît du sol / des données). Les concepts sont ensuite comparés, regroupés en catégories, et intégrés dans un modèle théorique.
    • Concrètement : transcrire les interviews des poules (données) ; identifier les thèmes récurrents (concepts : peur, curiosité, évitement, manipulation…) ; les relier pour construire une théorie (le modèle est obligatoire).
  • en phénoménologie : l’analyse vise à comprendre l’expérience subjective par des descriptions détaillées, en identifiant les thèmes centraux dans les récits.
    • Concrètement : interroger les poules, identifier les sentiments (surprise, danger, etc.) ; comprendre comment elles donnent du sens à cette expérience. Un modèle est possible.
  • en ethnographie : l’analyse interprète les pratiques et interactions du groupe.
    • Concrètement : observer comment les poules collaborent ou non face au couteau (organisation collective, conflit, etc.) et interpréter ce comportement dans leur environnement de ferme. Un modèle est possible.
Loading spinner

[Avent 2024 – Ecrire sa thèse] – 12/24 – Poser et affiner sa question de recherche

(Billet tardif aujourd’hui parce que : la bourre…)

Deux situations existent :

  • vous pouvez avoir une idée de thème vague sans question précise (éventuellement grâce aux méthodes évoquées dans ce billet) : dans ce cas, je vous conseille dans le billet d’hier de naviguer sur plusieurs bases (LiSSa, PubMed, Google Scholar notamment, Sudoc éventuellement…), en cherchant des sujets dans votre thématique, en lisant la section Discussion > Perspectives, en regardant les sujets similaires (utiliser BibliZap peut être utile aussi) ;
  • votre travail peut commencer très tôt par une question de recherche : très bien, il faut peut-être l’affiner.

Déjà, à ce stade de votre travail, où rien n’est lancé, tout est possible ! Je vous conseille même de ne pas vous contenter d’une seule question de recherche : cherchez-en plusieurs, et choisissez celle qui vous semble « la mieux ».

Mais qu’est-ce qui est « mieux » ? C’est le sujet de ce billet où on va parler de la bonne question de recherche.

Votre intérêt pour le sujet

Nous l’avons déjà dit plusieurs fois : ce qui compte avant tout, c’est votre intérêt pour le sujet. Je ne reviens pas dessus, mais c’est un point primordial pour votre motivation. Il doit être en tête de vos critères.

Plutôt qualitatif ou quantitatif ?

(A lire avec la voix de Bernard Campan dans les Trois frères en mode « plutôt Braaaaque, Vasarely » :D)

Si on veut être puriste, le choix de la méthode dépend uniquement de la question de recherche née de votre connaissance approfondie d’un sujet.

Je vous ai dit auparavant qu’il n’était pas indispensable d’avoir une connaissance approfondie pour une thèse de médecine (c’est différent pour une thèse d’université), mais de réfléchir à l' »arène du récit » comme dans un roman : si dans votre livre de fantasy, vous avez une magie basée sur les crayons de couleur, vous avez tout intérêt à connaître la taille, la forme, le prix de ces crayons (mais dans la plupart des livres de science-fiction/fantasy, ça n’est pas un élément détaillé ou connu par l’auteur) ; de la même façon, si votre thèse a besoin d’informations épidémiologiques, vous les donnez et s’il n’a pas besoin d’informations de physiopathologie, vous pouvez les connaître ou non…

Ici, j’ajouterais que le choix de la méthode dépend en réalité de ce que vous avez envie de faire. C’est le cas majoritaire de toute façon : un étudiant se dit « j’ai envie de faire du quantitatif » / « j’ai envie de faire du qualitatif » et réfléchit à son sujet en fonction. Tant pis pour le purisme, vive le pragmatisme 😀

Nous reviendrons plus en détail sur quantitatif / qualitatif plus loin, mais de façon brève (et utile à ce stade) :

  • le qualitatif vise à comprendre des phénomènes, expériences, comportements sociaux… Les données ne sont pas numériques mais textuelles ; l’analyse passe par une interprétation, des codages…
  • le quantitative vise à mesurer, comparer, associer des variables… Les données sont numériques ; l’analyse passe par des statistiques descriptives (moyenne, médiane, etc.) ou des tests (Student, Chi2, etc.)

Il ne faut pas « craindre » le quantitatif : vous pouvez pour votre thèse faire quelque chose de descriptif, il n’y a pas besoin d’utiliser forcément des modèles complexes et incompréhensibles.
Il ne faut pas non plus « sous-estimer » le qualitatif : c’est parfois vu (à tort) comme plus simple, car sans calcul… Ce n’est pas le cas, il y a d’autres difficultés, notamment sur l’analyse et la discussion des résultats !

Pour des raisons qui vous concernent, vous pouvez vouloir forcément un sujet quantitatif ou qualitatif.

Le pragmatisme !

On revient ici sur un point essentiel, mais si votre sujet est « comment traiter efficacement la maladie d’Alzheimer ? »… ça va être un tantinet complet !

Les essais cliniques ne sont pas faisables pour une thèse de médecine, pour des raisons de temps (sauf à s’intégrer à un gros essai en cours).

Comme on l’a déjà dit également, utiliser des bases existantes en open data (par exemple cette liste ici) permet de gagner du temps par rapport à la constitution d’une nouvelle. Il ne s’agit évidemment pas de dissuader à créer de nouvelles bases (la plupart du temps, ce sera nécessaire !), mais de réfléchir à ce qui est faisable… si votre département de médecine générale l’autorise bien sûr ! Un exemple

Ecrire sa question de recherche : PICO, PICo ou sans PICO ?

Il existe 2 acronymes proches : PICO (études quantitatives) et PICo (études qualitatives).

En quantitatif, le modèle PICO est un acronyme pour Population, Intervention, Comparison, Outcome (résultat).

Concrètement : chez la population P, l’intervention I est-elle associée au (meilleur) résultat O par rapport à l’intervention C ?

Ce modèle sera utile pour construire votre question de recherche précise dans :

  • les études épidémiologiques analytiques ;
  • les études diagnostiques (O est souvent « un diagnostic plus précis », selon des valeurs diagnostiques : sensibilité, spécificité, valeurs prédictives) ;
  • les essais cliniques ;
  • les revues systématiques ou méta-analyses.

Par contre, ce modèle n’est pas nécessaire dans :

  • les études qualitatives (explorer des perceptions, des comportements ou des expériences, sans intervention, comparaison et résultat attendu) ;
  • les études quantitatives exploratoires ou descriptives (sans intervention / comparaison) ;
  • ou encore la recherche fondamentale…

Si votre question est : « quel est le taux de consommation des AINS chez les patients courant au marathon de Paris ? »… il n’y a pas d’intervention (donc pas de contrôle) et pas d’outcome. C’est pourtant une question de recherche.
Si vous vous demandez « chez les coureurs de plus de 60 ans (P), est-ce que la consommation d’AINS (I) est associée à davantage d’abandon lors d’un marathon (O) que chez les coureurs de 18-59 ans (C) ? », il s’agit d’une étude épidémiologique analytique (comparant 2 groupes), et vous pouvez donc généralement utiliser le modèle PICO.

En qualitatif, le modèle PICo est un acronyme pour Population, Interest, Context

Concrètement : Quelles sont les expériences de population P pour le phénomène d’intérêt I dans le contexte C ? (ou que signifie I pour P dans le contexte Co ?) Par exemple :

  • « quelles sont les expériences des étudiants en médecine (P) pour l’utilisation des flashcards (I) dans le contexte de la préparation de leurs examens (Co) ? »
  • « que signifie être en bonne santé (I) pour les hommes de plus de 80 ans (P) polymédiqués (C) ? »

Dans les 2 cas, on peut ajouter T pour la temporalité (entre 2010 et 2020, sur les 50 dernières années etc.)

Un autre modèle a été proposé en français dans Initiation à la recherche qualitative en santé, dirigé par Jean-Pierre Lebeau : RAPaCE pour recherche (qualitative, quantitative ou mixte), approche méthodologique, phénomène analysé, concept mobilisé (attitudes, perspectives, expériences, etc.), échantillonnage.

Finaliser le premier jet de l’introduction

Une fois la question de recherche posée, votre premier jet d’introduction peut être finalisé…

L’introduction s’écrit un peu comme une nouvelle : tout le texte va mener à l’inéluctable chute de la (des) dernière(s) phrase(s). Là, votre introduction va devoir définir les termes de votre question de recherche puis y amener progressivement, par un chemin logique.

Nous sommes encore une fois dans une écriture itérative : votre question de recherche s’est nourrie de vos recherches qui ont permis de commencer à écrire votre introduction… et une fois la question posée, c’est votre introduction qui se nourrit se ses termes, et mène à de nouvelles recherches pour peaufiner.

Loading spinner

[Avent 2024 – Ecrire sa thèse] – 11/24 – Trouver ses mots-clés

Rien à voir mais le calendrier de juste avent des fictions sonores est lancé : j’ai eu le plaisir de l’inaugurer le 9 décembre (parce que j’étais le dernier retardataire à proposer un mono à François TJP)… Bonne écoute ! (Et comme annoncé, mon édito dans Egora est bien paru).

A travers les précédents billets, nous avons vu comment se motiver, comment trouver un sujet, comment utiliser Word efficacement (sans casser la mise en page, en ayant des outils pour une typographie et syntaxe de qualité)…
De manière générale, nous avons aussi vu comment rédiger efficacement : rédiger directement sans brouillon, utiliser les titres dans les styles de Word pour planifier les parties et les découper en sous-parties, écrire rapidement le premier jet pour avoir une trame générale — faire 80 % du travail en 20 % du temps —, puis peaufiner chaque partie avec l’amour de la précision et du retour aux sources initiales… tout en ajoutant évidemment la plus-value du travail avec des résultats inédits !
Enfin, nous avons vu comment sourcer avec Zotero, et comment récupérer des articles en entier (avec la BU, avec Sci-Hub, en demandant à l’auteur, etc.)

Maintenant que nous avons tous ces éléments qui définissent le cadre de travail, nous allons reprendre par partie… et voir comment faire des recherches sur les principales bases pour creuser votre sujet — notamment dans l’introduction, et dans la discussion !

(Attention, on ne parle pas ici de faire une vraie revue de littérature ; on évoquera ça plus tard. Il s’agit là de « papillonner » pour définir progressivement votre question de recherche en retrouvant les généralités, ce qui est connu sur le sujet, ce qui n’est pas connu… bref, en écrivant votre introduction !)

Casser les murs et trouver de nouveaux mots-clés

Un objectif souvent évoqué est de trouver les bons mots-clés et termes pour pouvoir réaliser des recherches efficaces, notamment les mots-clés MeSH (Medical Subject Headings) ; MeSH est un thésaurus biomédical publié par la National Library of Medicine (qui gère MEDLINE / PubMed) pour indexer les références et qu’on s’y retrouve facilement… ça tombe bien, c’est ce qu’on veut !

Oui… sauf que ça n’est pas toujours facile !

Pour ce billet, partons du principe que vous voulez travailler sur la surcharge administrative des médecins généralistes français. Vous n’avez pas encore de question de recherche précise, mais c’est ça votre thématique… Alors allons-y, voici plusieurs possibilités (plus ou moins ordonnées) pour avancer dans le sujet et les mots-clés en papillonnant (et en conservant une trace des articles intéressants à la fois dans Zotero ET en une-deux phrases dans votre thèse bien sûr !) :

  1. Taper « surcharge administrative médecins généralistes français » sur Google :
    • il y a des articles de presse, des questions au gouvernement (qui renvoie vers la mission flash de janvier 2023), et le site certificats-absurdes.fr ;
  2. Traduire l’expression sur DeepL (ou autre traducteur)
    • ici « administrative overload French GPs » ;
  3. Aller sur HeTop (ou MeSH Inserm) pour essayer de trouver un mot-clé MeSH à partir du terme français :
    • ici, on trouve « organization and administration » ;
  4. Aller sur LiSSa pour rechercher de la littérature scientifique francophone sur le sujet :
    • par exemple cet article qui a pour mots-clés : Épuisement professionnel; Stress professionnel
  5. Aller sur PubMed et entrer l’expression traduite (« administrative overload GPs ») :
    • par exemple cet article va nous apporter les mots-clés : general practitioners; job satisfaction; loss of meaning in work; primary health care.
  6. Aller sur Google Scholar, et tenter en français et en anglais :
  7. Réitérer le processus avec de nouveaux termes identifiés, par exemple ici avec bureaucratie :
    • Sur LiSSa : cet article parle de démocratie sanitaire ; celui-ci titre « La Recherche face au défi d’Homo bureaucraticus » ce qui est amusant.
    • Sur PubMed : cet édito dans BMJ qui parle de « ridiculous bureaucracy » en Angleterre ; celui-ci permet de trouver le mot-clé workload
    • Sur HeTop, retraduire les mots-clés en français <> anglais (par exemple, workload <> charge de travail)
    • Sous certains articles, comme celui-ci, les « similar articles » vous donnent déjà un panel étendu d’articles à lire sur votre thématique.
  8. Utiliser BibliZap à partir d’un article proche de votre thématique :

En résumé, vous n’avez pas trouvé un seul mot clé MeSH, mais vous avez quand même trouvé plusieurs termes utiles et trouvé de très nombreux articles qualitatifs et quantitatifs pour votre thématique.

L’ASTUCE « SPEEDRUNNER SA THÈSE »
Ne lisez rien à ce stade ! (Ou très peu, principalement les résumés…)
Un des problèmes de ce « papillonnage » entre les bases est qu’on peut y passer des jours et des semaines, en accumulant plein d’articles plus ou moins reliés sur la thématique, en se perdant en route…
Ne perdez jamais de vue les objectifs que vous avez aux différentes étapes de votre thèse : là, il s’agit de trouver les mots-clés, trouver quelques articles très proches de ce que vous aimeriez faire et éviter des scotomes importants sur votre sujet.
Pour éviter de passer trop de temps dans cette étape, donnez-vous un temps court pour avancer sur votre question de recherche par cette méthode, par exemple « dans 2 heures, je fais un point sur ce que j’ai trouvé et je propose au moins une idée de question de recherche ». Travailler avec des objectifs et des deadlines courts mais réalistes pourra vous aider à éviter de vous perdre.

Et pour un travail qualitatif ?

A ce travail ci-dessus (PubMed, LiSSa notamment), vous pouvez ajouter d’autres bases de données :

  • Persée : une base gérée par l’Ecole normale supérieure de Lyon et le CNRS ;
  • CAIRN : une base d’éditeurs francophones de SHS ;
  • PsycInfo : la base de l’American Psychological Association consacrée à la psychologie, aux sciences du comportement et à la santé mentale ;
  • JSTOR : une librairie numérique, parfois accessible via votre université ;
  • … et n’hésitez pas à voir les ressources en ligne proposées par votre université (par exemple ici à Lille).

Encore une fois, nous sommes ici à un stade précoce, où vous transformez une idée (créative, impulsive, palpitante, vague et sans contrainte) en une question (méthodique, réfléchie, stable et pondérée, formalisée ou conceptualisée, contrainte par le temps et le budget) (d’après les termes de Martinez L et Berkhout C, exercer 2009).

Construire une requête

Si votre question de recherche est définie, vous pouvez construire votre requête pour faire des recherches.

Il y a 6 opérateurs à connaître :

  • les connecteurs booléens : AND (et), OR (ou), NOT (sauf) vous permettent respectivement d’associer des mots-clés (violence ET enfants), d’utiliser des synonymes (violence OU agressivité) ou d’exclure des mots-clés (violence SAUF animale) ;
  • les guillemets permettent de faire une recherche d’expression et pas seulement de mots (avec « domestic violence » vous avez 14 000 références ; avec health democracy, vous en avez 57 000) ;
  • l’astérisque permet de tronquer un mot : * permet par exemple de chercher anim* pour animal, animaux, animalier, etc.
  • les parenthèses permettent de regrouper les mots-clés par concept, comme en mathématiques : par exemple ici (violence OU aggressivité) ET enfants SAUF anim*

Il existe aussi un constructeur de requêtes bibliographiques médicales, conçu par l’université de Rouen… qui aurait pu remplacer les étapes 2, 3, 4 et 5 ci-dessus puisqu’il traduit en anglais le mot-clé que vous proposez, permet d’associer des mots-clés avec connecteurs, et de trouver les articles sur LiSSA et PubMed !

Par exemple, si vous cherchez « organisation et administration » ET « charge de travail » ET « médecine générale », vous obtenez 5 articles LiSSa (dont un sur la délégation de tâches) et 1568 sur PubMed avec la requête ci-dessous… ou 14 si vous ajouter France dans les termes MeSH.

( ( ( (((((« workload »[MH] OR (« staff workload »[TW] OR « staff work load »[TW] OR « staff workloads »[TW] OR « workload, staff »[TW] OR « work loads »[TW] OR « workloads »[TW] OR « employee work loads »[TW] OR « employee work load »[TW] OR « work load, staff »[TW] OR « staff work loads »[TW] OR « workload »[TW] OR « employee workloads »[TW] OR « work loads, staff »[TW] OR « workloads, employee »[TW] OR « employee workload »[TW] OR « work load »[TW] OR « work loads, employee »[TW] OR « workload, employee »[TW] OR « work load, employee »[TW] OR « workloads, staff »[TW]))))) OR ((« workload »[MH] OR (« staff workload »[TW] OR « staff work load »[TW] OR « staff workloads »[TW] OR « workload, staff »[TW] OR « work loads »[TW] OR « workloads »[TW] OR « employee work loads »[TW] OR « employee work load »[TW] OR « work load, staff »[TW] OR « staff work loads »[TW] OR « workload »[TW] OR « employee workloads »[TW] OR « work loads, staff »[TW] OR « workloads, employee »[TW] OR « employee workload »[TW] OR « work load »[TW] OR « work loads, employee »[TW] OR « workload, employee »[TW] OR « work load, employee »[TW] OR « workloads, staff »[TW])))) ) AND (((« organization and administration »[MH] OR (« organization and administration »[TW] OR « administrative technics »[TW] OR « administration »[TW] OR « supervision »[TW] OR « administrative technic »[TW] OR « administrative techniques »[TW] OR « technique, administrative »[TW] OR « techniques, administrative »[TW] OR « administrative coordination »[TW] OR « administration and organization »[TW] OR « administrative technique »[TW] OR « coordination, administrative »[TW] OR « technics, administrative »[TW] OR « technic, administrative »[TW]))) OR ((« organization & administration »[SH] OR (« administrative management »[TIAB] OR « organizational structure »[TIAB] OR « organization »[TIAB] OR « organizational management »[TIAB] OR « organization & administration »[TIAB] OR « organization & administration »[TIAB] OR « administrative structure »[TIAB]))) OR ((((« organization and administration »[MH] OR (« organization and administration »[TW] OR « administrative technics »[TW] OR « administration »[TW] OR « supervision »[TW] OR « administrative technic »[TW] OR « administrative techniques »[TW] OR « technique, administrative »[TW] OR « techniques, administrative »[TW] OR « administrative coordination »[TW] OR « administration and organization »[TW] OR « administrative technique »[TW] OR « coordination, administrative »[TW] OR « technics, administrative »[TW] OR « technic, administrative »[TW])))))) ) AND (((« general practice »[MH] OR (« family medicine »[TW] OR « general practice »[TW] OR « practice, general »[TW]))) OR ((((« general practice »[MH] OR (« family medicine »[TW] OR « general practice »[TW] OR « practice, general »[TW])))))) ) AND (((« france »[MH] OR (« corsica »[TW] OR « france »[TW] OR « st. pierre and miquelon »[TW] OR « miquelon and saint pierre »[TW] OR « saint pierre and miquelon »[TW] OR « miquelon and st. pierre »[TW]))) OR ((((« france »[MH] OR (« corsica »[TW] OR « france »[TW] OR « st. pierre and miquelon »[TW] OR « miquelon and saint pierre »[TW] OR « saint pierre and miquelon »[TW] OR « miquelon and st. pierre »[TW]))))))

Que faut-il lire et dans quel ordre ?

Déjà, je le redis, il ne faut pas tout lire. Vous pouvez — ça n’est pas interdit —, mais ça n’est pas du tout indispensable.

Ce qui compte c’est :

  • de ne pas passer à côté d’un paramètre important de votre sujet : pour éviter ça, lisez un ou deux articles généraux sur le sujet (à défaut de page wikipedia, survoler la première page Google permet de lire qu’il y a eu un rapport remis au ministère de la santé, qu’il y a un site certificats-absurdes porté par le collège de la médecine générale, etc.). Le rapport et le site vous donneront déjà beaucoup d’éléments ;
  • de répondre ponctuellement à des questions qui vous sont utiles pour arriver à votre question de recherche (introduction) ou pour comparer votre recherche à la littérature (discussion).

Dans les études scientifiques, vous devrez privilégier dans vos références bibliographiques :

  • les méta-analyses et revues de littérature (notamment en début d’introduction pour les généralités sur le sujet)
  • les grosses revues : NEJM, BMJ, Lancet, JAMA, etc. (Cancer, Neurologie… dans les disciplines correspondantes)
  • les « sources » : si un score utile a été publié pour la première fois en 1958 dans une obscure revue, vous pouvez citer cette référence (et pas un article de 2024 qui utilise ce score).
  • les revues plus modestes, indexées et/ou faisant référence dans votre discipline : Revue d’épidémiologie santé publique, Exercer, Thérapie, etc.
  • les rapports (HAS, Insee, DREES, InCA, ANSM, rapport de mission flash, etc.)
  • les thèses (via SUDOC)

C’est la même chose dans vos lectures : ça ne sert pas vraiment de lire xx thèses sur un sujet, privilégiez des ressources plus encyclopédiques (soit vraie encyclopédie type UpToDate, ClinicalKeys, etc. ; soit article de synthèse dans une grosse revue).

Enfin, quand vous lisez un document et que vous trouvez une idée, notez-la en une phrase sur votre thèse (idéalement dans la bonne sous-partie) AVEC la référence Zotero.

Et si je n’y arrive pas tout seul ?

Votre directeur de thèse peut bien sûr vous aider.

Sinon, les bibliothécaires sont aussi d’une aide précieuse, notamment lorsque vous voudrez faire une requête pour votre travail, pour une revue de littérature… Ils savent vérifier la qualité et l’exhaustivité des mots clefs et de la requête, sauront vous expliquer comment utiliser PubMed (il existe des formations, comme pour Zotero dont on a parlé ici). Certaines BU peuvent aider à distance, comme celle de la BIU Santé médecine.

Loading spinner

[Avent 2024 – Ecrire sa thèse] – 10/24 – Comment récupérer des articles en entier ?

Dans le billet précédent, je dis qu’il faut tout sourcer et revenir autant que possible aux « sources » des informations (et pas un chiffre repris en 2024 par les autorités sur la base d’une étude de 1981)…

Mais souvent, les principaux moteurs de recherche (notamment PubMed — ou Google Scholar, JSTOR ou autre) ne vous donneront accès qu’aux références et à l’abstract. Un lien permet d’accéder à l’article via le site de l’éditeur ou votre bibliothèque… mais pas toujours.

Faisons le point sur les situations existantes et tentons de répondre à la question : « comment récupérer les textes complets » ?

Accès libre ou accès payant

Le nombre de l’édition scientifique est partagé entre absurdité et scandale. J’en ai parlé dans ce billet sur les revues prédatrices. Pour faire court, les chercheurs ont deux possibilités :

  • payer pour lire des articles en accès payant que des chercheurs ont financé, écrit, et corrigé sur l’avis formulé bénévolement par d’autres chercheurs ;
  • ou payer pour que leur article écrit, corrigé sur l’avis formulé par d’autres chercheurs… soit mis en accès libre pour les autres chercheurs.

Dans les deux cas, l’éditeur est le grand gagnant… en prenant l’argent des chercheurs, ou plus largement de la population (sur les fonds de la recherche).

Si l’accès est libre (Open Access), le chercheur a payé quelques milliers d’euros/dollars pour que tout le monde puisse lire le fruit de son travail : pas de problème pour vous, lecteur, donc ! Sur PubMed, à droite, dans « Full Text Links », vous trouverez l’accès.

Mais si l’accès est payant… et bien ça va vous coûter 30-50€ par article, et c’est un budget. Nous pouvons donc chercher d’autres moyens d’y accéder.

Accès via des abonnements de bibliothèque

Les universités s’abonnent généralement à quelques revues : avec vos identifiants de l’université, vous pourrez avoir quelques accès supplémentaires. Là encore sur PubMed, à droite, dans « Full Text Links », vous trouverez l’accès.

Petit aparté : rappelons à nouveau ici que les sites des bibliothèques sont riches en ressources (par exemple ici celle de l’université de Lille). Le format papier existe toujours au sein de la bibliothèque et peut être emprunté ou photocopié… ça demande toutefois du temps, et semble un peu désuet à l’heure du tout numérisé sur internet ! Ca reste néanmoins une option à considérer : votre bibliothèque peut aussi emprunter des documents dans d’autres (prêt-entre-bibliothèques).
La Bibliothèque Nationale de France (BNF) permet aussi des accès à des ressources (vous pouvez souscrire à un pass à un prix modeste, qui vous donne un large accès à la presse !). Pour simplifier la navigation, vous pouvez aussi utiliser le site non affilié easybnf.fr.

Si vous n’avez pas accès par ce biais légal, ça se complique…

« On m’a parlé de Sci-hub » ?

Oulà, je vous arrête tout de suite, vil personnage : Sci-Hub est une bibliothèque « clandestine » : un site web qui un accès libre à plus de 80 millions d’articles publiés avant 2022 ! Sci-Hub a été fondé en 2011 par Alexandra Elbakyan, la « Robin des Bois » de la science moderne, volant les articles scientifiques aux éditeurs pour rendre au public. Elle décrit ses motivations sur son site, à l’onglet « Elbakyan » ; le Monde a comparé son site au « Pirate Bay » de la recherche scientifique.

Le site a régulièrement été désactivé, mais a été repris avec d’autres extensions de domaine, mises à jour sur la page wikipedia de Sci-Hub (on lit par exemple que sci-hub.se, .st et .ru fonctionnent actuellement, mais plus .cc, .bz, .ac, .tw, etc.).

Devant cette course à l’échalote du blocage d’extension, en France, les fournisseurs d’accès internet ont été obligé de bloquer ce site. Ainsi, vous n’aurez pas de possibilité d’accéder à sci-hub.se, si vous n’êtes pas dans l’une des 3 situations suivantes :

  • vous utilisez le navigateur gratuit Tor Browser
  • vous utilisez un VPN
  • ou vous utilisez Google Chrome et dans Réglages > Confidentialité et sécurité > Sécurité > Paramètres avancés, vous avez activé « utiliser un DNS sécurisé » avec par exemple pour fournisseur DNS « Google (public DNS) » (ou tous les autres, ou en modifiant votre DNS en CloudFlare DNS 1.1.1.1.).
Faites en sorte qu'il soit plus difficile pour les personnes ayant accès à votre trafic Internet de voir quels sites vous consultez. Chrome utilise une connexion sécurisée pour rechercher l'adresse IP d'un site dans le système de noms de domaine (DNS).
Attention, ce type de réglage pourrait vous permettre d’accéder à un site illégal tel que sci-hub.se

Pour récupérer un article par ce biais, il suffit de récupérer le DOI ou le PMID sur PubMed (ou sur le site de l’article…), et le copier :

  • soit le DOI ou le PMID dans la barre de recherche sur sci-hub
  • soit le DOI à la suite de l’URL (sci-hub.se/xxxxxxxx où xxxxxxxx est le doi évidemment).

Je n’ai bien sûr jamais eu recours à ce type de piratage ; d’ailleurs, si j’ai cité Alexandra Elbakyan dans mes remerciements de thèse d’université, c’est uniquement pour saluer le courage de cette scientifique, qui a accepté de mettre la moralité devant la légalité.

Pour information, LibGen (Library Genesis) est une autre bibliothèque clandestine dont l’URL change régulièrement, mais peut être retrouvée sur sa page Wikipedia. Elle est plus difficile d’accès sans VPN…

Je n’ai trouvé l’article nulle part…

Hum humm, je vois. Il existe d’autres solutions, plus aléatoires :

  • Essayer sur Google Scholar, qui retrouve parfois le PDF ailleurs ;
  • Chercher directement sur le site de la revue (notamment pour un vieil article qui a peut-être été mis en ligne sans le lien sur PubMed) ;
  • Installer l’extension PaperPanda sur Google Chrome (mais ça ne fonctionne pas aussi souvent que Sci-hub) ;
  • Lancer une bouteille à la mer avec le hashtag #ICanHazPDF sur Twitter, ou sur /r/Scholar sur Reddit ;
  • Chercher l’article sur ResearchGate, un réseau de chercheurs, et demander à l’un des auteurs de vous le fournir par message privé ;
  • Demander à l’auteur correspondant par mail (chaque article à un auteur correspondant, dont les coordonnées sont accessibles notamment sur PubMed).

Et si vraiment rien de tout ça ne fonctionne… cherchez une autre référence !

Loading spinner