Ceci est une ancienne révision du document !


Le QI

Le QI, ou Quotient Intellectuel, est le résultat d'une mesure de l'intelligence réalisée par un test de QI. Le résultat de la mesure se présente sous la forme d'un nombre (par exemple : 124), et n'a de valeur qu'en référence au test correspondant (par exemple : “j'ai eu un score de 124 au test WAIS IV”).

Cette définition amène beaucoup de commentaires, sur ce qu'est l'intelligence, sur les tests de QI, et sur la validité du résultat.

L'intelligence

Les tests de QI

Tests pour enfant

  • Le WPPSI-III s’adresse aux enfants en deux versions : de 2 ans et 6 mois à 3 ans et 11 mois, et de 4 ans à 7 ans et 3 mois ;
  • Le WISC est un test pour les enfants de 6 ans à 16 ans et 11 mois, il a un écart type de 15 ;
  • Le K-ABC est un test pour les enfants de 2 ans ½ à 12 ½.
  • Le test de Stanford Binet est utilisable à partir de 2 ans1)2).

Tests pour adulte

  • Le WAIS, ou Wechsler Adult Intelligence Scale, est le test de QI pour adulte le plus utilisé en France. La moyenne est de 100, l'écart type de 15, le score maximum de 160, la version courante est la version IV en France depuis 2011.
  • Raymond Bernard Cattell a créé plusieurs tests de personnalité et de QI, le test de QI le plus utilisé étant le Cattell Culture Fair III, familièrement appelé échelle de Cattell. La moyenne est de 100 et l'écart type de ce test est de 24.
  • Le test de Stanford Binet, actuellement dans sa cinquième édition. La version 4 a une moyenne de 100 et un écart type de 16, la version 5 a une moyenne de 100 et un écart type de 15. Différentes versions de ce test permettent de mesurer des valeurs de QI très élevées (form L-M pour la version 4, Extended IQ pour la version 5)3)4).

Tests pour surdoué

Il existe des tests spécifiques pour QI élevés (voici une liste). Certains, comme le test Titan créé par Ronald K. Hoeflin, sont considérés comme suffisamment fiables pour évaluer des niveaux de QI d'une personne sur un million, et être admis comme test d'entrée dans une société de surdoués comme The Mega Society.

Limites et défauts des tests de QI

L'indication d'un niveau de QI ne suffit pas, il faut encore savoir à quelle échelle il se rapporte5). Les deux échelles les plus utilisées sont le WAIS et le Cattell, toutes deux avec une moyenne de 100, le WAIS avec un écart type de 15 et le Cattell avec un écart type de 24. Une personne ayant un QI de 100 sur l'échelle de Cattell aura un QI de 100 mesuré par le WAIS, et une personne qui aura un score de 115 au WAIS aura un QI de 124 sur l'échelle de Cattell.

Certains tests, par exemple le WAIS, sont étalonnés par pays, pour que la population du pays ait un QI moyen de 100. Il est donc possible d'avoir un résultat différent au test selon le pays dans lequel on passe le test, la différence pouvant atteindre plusieurs dizaines de points6)7).

De même, certains tests sont étalonnés par tranche d'âge. C'est le cas du WAIS. Pour un même résultat brut aux tests, le QI mesuré dépendra de la tranche d'âge. L'effet de l'âge sur le QI est étudié dans l'article : Le WAIS IV. Il serait hasardeux de dire que deux personnes ayant le même QI sont du même niveau d'intelligence si elles ne sont pas dans la même tranche d'âge ou dans des tranches d'âge proches.

Des chercheurs ont établit qu'en fonction des stimulations, le QI peut gagner ou perdre jusqu'à 20 points chez les jeunes avant 20 ans8)9).

Les consommateurs de cannabis à long terme présentent un déclin du QI entre l'enfance et le milieu de la vie (moyenne = 5,5 points de QI)10)11).

La présentation habituellement rencontrée de la courbe en cloche des QI donne l'impression que la répartition des QI de la population d'un pays est une gaussienne, et que les tests sont étalonnés par pays pour que dans chaque pays l'écart type ait une valeur donnée (15 dans le cas du WAIS). Mais rien ne prouve que la répartition des QI est une gaussienne, en particulier pour les pays qui ont été peuplés par immigration de populations hétérogènes (exemples : les Etats-Unis, le Brésil). Dans le cas où plusieurs populations hétérogènes sont présentes dans un pays, la courbe de répartition des QI pourrait être une superposition de gaussiennes12) :

Vouloir “forcer” sur une telle population un écart type de 15 (cas du WAIS) va alors amener à “comprimer” la dispersion des QI, et à sous-estimer les cas de douance (et de débilité)13). Et, de facto, la modélisation par une gaussienne de la courbe des QI d'une population, telle que le font les tests en parlant de moyenne et d'écart type, est une fabrication, un artifice. La répartition réelle des QI d'une population a toute les chances de ne pas être une gaussienne parfaite, et il est très probable que le nombre de personnes ayant un QI supérieur à 130 (ou deux écart types, pour généraliser) est différent de 2,28%. Il peut très bien y avoir des bosses et des trous un peu partout sur la courbe.

Les tests de QI sont ré-étalonnés lors d'un changement de version (exemple : passage du WAIS III au WAIS IV). Or il a pu être observé que quand on garde une version ancienne d'un test sans la ré-étalonner, il arrive que dans certains pays et sur certaines périodes, le QI moyen de la population, tel que mesuré par ce test invariant, évolue significativement, et augmente de 3 à 7 points de QI par décennie14)15). Cet effet est appelé effet Flynn. Si les tests sont ré-étalonnés périodiquement, il serait donc possible, pour une personne, d'être par exemple testée avec un QI de 137, et 20 ans après avec un QI de 123 tel que mesuré par la version suivante du test, le changement dans le score obtenu ne résultant pas d'un changement de son intelligence mais d'un effet Flynn important en conjonction avec un ré-étalonnage du test (le QI moyen de la population, dans cet exemple, ayant progressé de 14 points sur la période). Note : cette vision de l'effet Flynn est contestée16).

La plupart des tests de QI effectuent une mesure de l'intelligence sur une liste de formes d'intelligence plus réduite que celles identifiées par Howard Gardner17)18). Les formes d'intelligences habituellement testées sont l’intelligence logico-mathématique, l’intelligence spatiale et l'intelligence verbo-linguistique, soit trois formes d'intelligence sur neuf. Ceci dit, l'approche de Gardner est contestée19). Un contre-argument à Gardner est qu'on ne teste pas, dans le WISC ou la WAIS des formes d'intelligence, mais des fonctions cognitives. C'est le résultat global qui est censé “parler”, “évoquer”, rendre compte de l'intelligence. Ces fonctions ne sont plus les mêmes qu'il y a 40 ans.

Le résultat du test présente une grande sensibilité aux difficultés psychologiques et de comportement de la personne qui passe le test. Il est possible de voir une mesure de QI progresser de plusieurs dizaines de points20)21) après traitement des problèmes de comportement.

De même, le résultat du test présente une grande sensibilité à la motivation de la personne qui passe le test. Il est possible d'augmenter cette motivation en proposant une récompense financière en fonction du score obtenu au test de QI. Pour des récompenses inférieures à 10$, l'effet sur le résultat est en moyenne de 0,65 écart-type (soit 10 points de QI pour le test WAIS). Pour des récompenses supérieures à 10$, l'effet moyen peut dépasser 1,6 écart-type (soit 24 points de QI)22)23).

Le résultat du test présente une petite variabilité selon le professionnel qui fait passer le test et calcule les scores, le résultat pouvant varier de quelques points dans un sens ou dans l'autre selon le professionnel24).

Le test Cattell Culture Fair III se veut a-culturel, mais ce n'est pas le cas de tous les tests de QI. Le test WAIS comprend une partie sensible à la culture de la personne qui passe le test, avec des questions du genre “Qui a peint le plafond de la Chapelle Sixtine ?”. Si la personne qui passe le test n'est pas issue de la culture pour laquelle le test a été étalonné, le résultat du test peut être sous-estimé.

De même, le test WAIS est sensible à la langue natale de celui qui passe le test, et si une personne dont la langue natale n'est pas le français passe le test WAIS en français, le résultat du test peut être sous-estimé.

La mesure effectuée par le test est influencée par certains handicaps, notamment ceux en «dys-» (dys-lexie, -orthographie, -graphie, -calculie, -praxie…) qui gênent la personne dans sa compréhension des consignes ou dans leur exécution25), alors que ces handicaps sont assez répandus chez les surdoués. Pour les tests modernes, le manuel du test traite de ces handicaps, le test permettant souvent de les évaluer, sans pour autant que le QI mesuré soit imperméable à l'influence de ces handicaps.

Dans une population “tout-venant”, l'auto-corrélation entre deux mesures de QI pour un même individu à des moments différents varie entre 0,86 26)27) et 0,96 28), ce qui indique une variabilité de la mesure. Pour une population d'individus surdoués, la corrélation entre deux mesures de QI peut tomber à 0,4929).

La cross-corrélation entre plusieurs tests de QI est souvent mauvaise, y compris entre plusieurs versions d'un même test30). En d'autres termes, différents tests ne donnent pas la même valeur de QI31)32).

Annexes

Articles connexes

Liens externes

Mots clés

Notes et références

5) Pour être tout à fait précis, il faudrait préciser l'échelle correspondante (exemple : WAIS), la version du test (exemple : WAIS III), le pays dans lequel le test a été passé (exemple : la France), pour tenir compte de l'étalonnage par pays, l'année de passage du test (exemple : 2005), pour tenir compte du ré-étalonnage périodique, et l'âge de la personne au moment du passage du test (exemple : 23 ans), pour tenir compte de l'étalonnage par tranches d'âge.
6) voir la section QI MOYEN PAR PAYS SELON R. LYNN & T VANHANEN de la page de statistiques sur le QI de douance.org, ou consulter le tableau complet.
7) Note d'Eric Turon-Lagot : la table http://www.isteve.com/IQ_Table.htm me semble très curieuse car très peu de pays utilisent le WISC… la France semble avoir utilisé un test inconnu, les USA ont utilisé le test Binet-Simon… (Barbados utilise le test WISC-R, révisé depuis 20 ans déjà…). Ce tableau de 2002 me semble inintéressant au possible, d'autant que les résultats présentés datent de 1962 et 1979 pour la France… En règle générale, je trouve intellectuellement intéressant de comparer les pays entre eux, mais… sur des éléments communs ! Là, il n'y en a aucun. L'effet Flynn pour la France (3) ne veut rien dire à mes yeux. Cet effet, tout comme le fait que la plupart des tests ne sont pas “culture free”, fait que s'il me semble intéressant de comparer des pays entre eux, cela doit être fait avec une certaine prudence (notamment en ce qui concerne l'écart type… c'est-à-dire que 2 pays qui auraient des scores de 99 et 102, cela indiquerait que les 2 pays sont “similaires” sur le plan statistique). D'autre part, aucun pays ne donne d'évaluation après 1994 : les résultats datent donc un peu beaucoup, surtout si l’on considère que la conception de l'intelligence a beaucoup changé ces 10 dernières années.
9) Verbal and non-verbal intelligence changes in the teenage brain Sue Ramsden, Fiona M. Richardson, Goulven Josse, Michael S. C. Thomas, Caroline Ellis, Clare Shakeshaft, Mohamed L. Seghier, Cathy J. Price. Nature 479, 113–116.
11) Long-Term Cannabis Use and Cognitive Reserves and Hippocampal Volume in Midlife Meier, M. H., Caspi, A., R. Knodt, A., Hall, W., Ambler, A., Harrington, H., … & Moffitt, T. E. (2022). Long-Term Cannabis Use and Cognitive Reserves and Hippocampal Volume in Midlife. American Journal of Psychiatry, appi-ajp.
12) Loi normale, section Mélange de populations
13) Pour illustrer ce point, on pourrait faire immigrer sur une île hypothétique deux français, l'un testé en France avec un QI de 140, l'autre testé en France avec un QI de 60. Une tentative d'étalonnage du WAIS sur cette île donnerait un QI moyen de 100 mais un écart type trop important, et le test serait modifié jusqu'à ce qu'un des habitants de l'île soit testé avec un QI de 115 (et non 140) et l'autre avec un QI de 85 (et non 60) : écart type 15, le test est étalonné.
15) La mesure de l'effet Flynn par pays montre aussi une décroissance du QI moyen par décennie pour certains pays.
16) Note d'Eric Turon-Lagot : L'hypothèse d'une personne testée à 137 et 20 ans après ne correspond à rien de ce que l'on sait de l'effet Flynn. La “diminution” de ses performances n'est en aucun cas due à l'effet Flynn. Il y a 2 choses importantes à savoir : l'effet Flynn est pris en compte et corrigé pour que le cas cité n'existe pas, ceci pour une raison importante : dans le cas de maladies évolutives, il est important pour les praticiens d'avoir une mesure qui reste fidèle… La fidélité d'une version de test à l'autre est testée et il en est tenu compte dans l'étalonnage. Passer de 137 à 123 ne correspond pas du tout à l'effet Flynn. Si cet exemple est tiré d'un cas réel, la diminution doit être envisagée comme un possible trouble.
17) Voir la théorie des intelligences multiples d'Howard Gardner.
19) Note d'Eric Turon-Lagot : les intelligences “identifiées” par H. Gardner font maintenant rire tous les professionnels sérieux car ce Monsieur a bien compris qu'en faisant croire à chacun qu'il est intelligent (6 formes, puis 8, 9, 12 récemment… cela ne présente plus aucun intérêt de laisser croire que toute fonction intellectuelle est “une intelligence” en soi), dans un domaine cela serait bien plus lucratif (il touche plus de monde) qu'en ne parlant qu'à 2,5% de la population… Un malin ce Gardner ! Ce qui t'amène à penser (et écrire…) que les tests d'intelligence n'évaluent qu'un nombre réduit de formes d'intelligences…
20) PERSONNES À HAUT POTENTIEL, Mélanie BIDAUT GARNIER, 2008, page 5, qui dans ce texte cite l'article de G. Prat : “Vingt ans de psychopathologie de l'enfant doué et surdoué en internat psychothérapique” initialement paru dans la revue NEUROPSYCHIATRIE DE L'ENFANCE ET DE L'ADOLESCENCE, 27e année - Numéro 10-11 - Octobre-Novembre 1979, Les surdoués, Expansion Scientifique Française, 1979, in-4, 60 pages.
21) Le complexe de l'albatros : L'inhibition intellectuelle chez l'enfant intellectuellement précoce. Docteur Alain GAUVRIT, 2001
24) Scoring Reliability on the Wechsler Adult Intelligence Scale–Third Edition (WAIS-III), Joseph J. Ryan & Summer D. Schnakenberg-Ott, Central Missouri State University, 2003
25) Cécile Bost, Différence et souffrance de l'adulte surdoué, Vuibert, 2011, page 19
26) cette valeur est identique à la corrélation des QI entre des jumeaux monozygotes élevés ensembles
27) voici un exemple de mesure sur 6 personnes, qui présente une auto-corrélation de 0,86 : lors du premier passage du test, les personnes obtiennent respectivement un score de 100, 110, 120, 130, 140 et 150. Lors du deuxième passage du test, quelques temps après, les personnes obtiennent respectivement un score de 92, 121, 127, 115, 131 et 159.
29) Les échelles de Wechsler : des qualités psychométriques non valables pour les HP, qui cite Ellsey et Karnes (1990) à propos de la version révisée du WISC (le WISC-R).
31) voir le chapitre Reliability de l'article IQ test
Imprimer/exporter
Partager cette page