Suis-je peut-être trop grand pour mon travail ?

En d’autres termes, ne peut-on vraiment pas comparer des pommes et des poires ? Dans cet article, nous allons nous pencher sur l’utilité et la nécessité des normes de test, car ce n’est qu’en faisant des comparaisons justes que l’on obtient des évaluations pertinentes.

Vous trouvez la question plutôt étrange et vous vous demandez quel est le rapport avec les normes de test ? Pour de nombreux emplois, vous avez raison d’être sceptique. Toutefois, si vous aviez l’intention de conduire des voitures de course de manière professionnelle, une taille supérieure à 1,80 m serait plutôt malvenue. D’une part en raison de l’espace restreint dans le véhicule, mais aussi en raison du poids plus élevé. C’est donc le contexte qui détermine quelle question et quelle comparaison concrète est la plus pertinente.

En règle générale, les adultes sont capables de répondre à la question de savoir s’ils sont plutôt grands ou petits. Grâce à l’expérience quotidienne avec d’autres personnes, nous avons établi une sorte de « norme mentale » subjective pour la taille et pouvons donc estimer si nous sommes plutôt plus grand, plus petit ou à peu près de la même taille que la plupart des autres personnes. Mais si vous voulez répondre à cette question de manière plus précise, par exemple dans le cadre d’examens médicaux, vous devez 1) mesurer votre taille et 2) la comparer à celle d’un groupe approprié. La réponse à cette question apparemment banale varie en fonction de la mesure utilisée et du groupe auquel on la compare (par exemple, adultes, enfants, joueurs de basket-ball professionnels). Il en va de même pour les tests psychologiques.

Pourquoi des normes de test ?

Un Test psychologique est l’étalon avec lequel nous pouvons mesurer les caractéristiques psychologiques. Cependant, contrairement à la taille, il est difficile, voire impossible, d’observer directement ces caractéristiques. Si l’on peut avoir une idée relativement précise de sa taille, il est beaucoup plus difficile d’évaluer des caractéristiques psychologiques telles que la « conscience » ou la « pensée logique et déductive ». La propre « norme mentale » est dans ce cas totalement insuffisante. Les normes de test permettent de remédier à cette situation et servent à comparer les résultats de test d’une personne à ceux d’un groupe de référence pertinent. Contrairement aux centimètres, pour lesquels nous avons construit un certain « sentiment », une valeur brute de test dit rarement quelque chose sur une personne. Si une personne a réussi 7 des 15 épreuves d’un test, cela pourrait être un bon ou un mauvais résultat, selon la difficulté des questions. La valeur brute dans un Test n’a de sens que si l’on sait comment d’autres personnes ont obtenu des résultats dans le Test. Le groupe de comparaison est ce que l’on appelle un échantillon normatif, c’est-à-dire un groupe de personnes le plus large possible, représentatif de la population cible du test et testé avec Test. Les valeurs standard peuvent ensuite être calculées sur la base des données de test de l’échantillon standard. Les valeurs de la norme donnent directement des informations sur la position de la personne par rapport à l’échantillon de la norme en ce qui concerne une caractéristique psychique. Ainsi, un résultat peut être interprété comme une performance supérieure, inférieure ou moyenne au test ou comme un niveau élevé, faible ou modéré de traits de personnalité, d’attitudes ou d’intérêts.

Quels sont les types d’échantillons standard ?

Les tests psychologiques peuvent être utilisés pour de nombreuses questions différentes. Afin de fournir un groupe de comparaison adapté à chaque question ou personne, de nombreux tests proposent plusieurs échantillons standard. Il existe souvent un échantillon de référence représentatif de la population générale. Dans ce contexte, représentatif signifie que la distribution des caractéristiques personnelles pertinentes telles que l’âge, le sexe ou le niveau d’éducation dans l’échantillon est comparable à celle de la population générale. Sur la base de ces (grands) échantillons normatifs représentatifs de la population, des normes de sous-groupes séparés par âge, sexe et/ou niveau d’éducation (par exemple, groupe d’âge 50-59 ans) sont également créées la plupart du temps. Selon le site Test et la question posée, il peut également être utile d’utiliser d’autres normes spécifiques au groupe (par exemple, séparées par profession, type d’école ou maladie). Contrairement aux normes représentatives de la population, qui sont le plus souvent des échantillons stratifiés ou des échantillons par quotas, ces normes spécifiques à un groupe sont souvent des échantillons dits de crise. Plus le groupe de population est spécifique et petit (par exemple, les footballeurs allemands de moins de 19 ans, en deuxième division), plus ces échantillons par crise sont susceptibles d’être représentatifs de la population cible.

Quels sont les différents types de normes ?

En ce qui concerne les valeurs standard, on distingue essentiellement deux groupes : Les pourcentages (PR) peuvent être calculés sur la base de la fréquence relative de certaines valeurs brutes de test dans l’échantillon standard (au moyen d’une transformation de surface). Un rang de pourcentage indique le pourcentage de l’échantillon standard qui a obtenu un résultat de test égal ou inférieur. Par exemple, un PR = 87 signifie que 87 % de l’échantillon standard a obtenu un résultat de test identique ou inférieur, ou que 13 % de l’échantillon standard a obtenu un résultat supérieur. En revanche, les normes standard indiquent le nombre d ‘écarts-types entre le résultat du test et la moyenne de l’échantillon standard. La base de toutes les normes standard sont des valeurs z avec une moyenne (M) de 0 et un écart-type (ET) de 1. Par conséquent, une valeur z = -0,5 signifie que le résultat du test est inférieur d’un demi-écart-type à la moyenne de la norme. Les valeurs z étant peu pratiques en raison des décimales et du changement de signe, d’autres normes standard ont été développées. Tout comme la conversion de Celsius en Fahrenheit, la conversion des valeurs z en d’autres normes standard n’est qu’une transformation linéaire. Les normes standard peuvent donc être changées à volonté. Les normes standard les plus fréquemment utilisées sont par exemple les valeurs T (M=50, ET=10) ou les valeurs QI (M=100, ET=15). Si les valeurs du test suivent une distribution à peu près normale, ces normes standard peuvent être interprétées de la même manière que les RP, sur la base de la distribution normale standard. Un QI = 130 représente un résultat supérieur de deux écarts-types (2 x 15) à la moyenne (QI=100) et signifierait que seuls ~2,5 % de l’échantillon standard ont un meilleur résultat au test.

Bon à savoir : Contrairement aux pourcentages (niveau de l’échelle des rangs), les normes standard (niveau de l’échelle des intervalles) permettent d’interpréter les différences entre les valeurs de test. Par exemple, une baisse de performance de 20 valeurs T est deux fois plus importante qu’une baisse de 10 valeurs T. Pour les pourcentages, ce type d’interprétation n’est pas autorisé car il permet uniquement d’évaluer si les valeurs de test sont supérieures, inférieures ou égales et non de combien elles sont supérieures ou inférieures.

Comment décider de la norme à utiliser ?

Le choix correct de l’échantillon de la norme est essentiel pour l’interprétation des résultats de test. Selon la norme utilisée, le contexte dans lequel les résultats peuvent être interprétés change également. Avec une taille de 177 cm, on fait clairement partie des personnes plus grandes que la moyenne au Japon, alors qu’aux Pays-Bas, on se situe « seulement » dans la moyenne. En revanche, si l’on veut établir une comparaison entre les sexes, cette taille serait supérieure à la moyenne pour une femme dans les deux pays. Il convient donc d’être prudent lors de l’interprétation d’une valeur standard. D’une part, selon l’échantillon de la norme, la valeur de la norme change, d’autre part, une même valeur de la norme peut signifier autre chose selon le choix de l’échantillon de la norme. La valeur standard de QI = 130 mentionnée plus haut pourrait indiquer une surdouance dans un test d’intelligence. Ce n’est toutefois pas le cas si l’échantillon de référence est composé exclusivement de personnes diagnostiquées avec une intelligence réduite. En principe, il faut choisir la norme la plus appropriée pour répondre à une question diagnostique concrète pour une personne donnée. Cela semble très simple, mais ce n’est souvent pas le cas. Il peut arriver que l’on utilise des normes différentes pour une même personne en fonction de la question posée ou que l’on utilise des normes différentes pour une même personne en dépit d’une question identique.

Exemple 1

Un homme de 84 ans a été victime d’un accident vasculaire cérébral. Dans le cadre de son séjour de rééducation, l’objectif est de déterminer s’il existe des signes de troubles cognitifs. Les performances dans de nombreux domaines de la fonction cognitive diminuent avec l’âge. Si l’on veut donc savoir si une performance cognitive est adaptée à l’âge ou non, il faut utiliser autant que possible des normes spécifiques à l’âge de personnes en bonne santé. Cela permet ensuite de déterminer si l’homme est atteint de troubles cognitifs par rapport à d’autres personnes en bonne santé du même âge. Si l’on souhaite également évaluer la gravité de la déficience, on peut en principe utiliser la norme spécifique à l’âge pour déterminer dans quelle mesure le sujet se situe en dessous de la moyenne. Cependant, il arrive souvent que les normes basées sur la population générale différencient moins bien dans les zones extrêmes de l’éventail des caractéristiques et qu’il y ait des effets de plancher ou de plafond selon l’orientation du Test. Par conséquent, la comparaison avec un échantillon de référence clinique peut être utile pour évaluer la gravité. Par exemple, si un échantillon standard de personnes ayant subi un AVC léger à sévère est disponible pour le site Test, il est possible d’évaluer plus précisément la sévérité des troubles cognitifs.

Exemple 2

Après qu’une femme de 67 ans a conduit sa voiture en étant fortement alcoolisée, les autorités lui ordonnent de suivre une formation complémentaire et de passer un examen de psychologie routière afin d’évaluer ses capacités psychologiques spécifiques à la conduite automobile. L’utilisation d’une norme spécifique à l’âge serait insuffisante, car il ne s’agit pas dans ce cas de comparer avec d’autres personnes du même âge ou souffrant de la même maladie , mais avec l’ensemble des conducteurs. Tout comme les limitations de vitesse, ces exigences cognitives minimales s’appliquent de la même manière à tous, quel que soit leur âge ou leur état de santé. Par conséquent, pour répondre à la question, il convient d’utiliser une norme globale non spécifiqueà l’âge de la population générale adulte. La femme n’est donc pas seulement comparée à ses pairs, mais plus généralement à toutes les personnes adultes en bonne santé. Dans ce cas, la norme globale non spécifique à l’âge est probablement plus « stricte » que si l’on utilisait une norme de sous-groupe spécifique à l’âge. On peut en effet supposer que le niveau moyen de performance cognitive est plus élevé en raison de la proportion plus importante de personnes plus jeunes dans la norme globale, ce qui augmente le niveau minimum requis pour l’aptitude à la conduite.

Exemple 3

Dans le cadre d’une procédure de sélection en plusieurs étapes, une compagnie aérienne souhaite notamment déterminer quels candidats présentent les meilleures capacités cognitives. Pour que l’évaluation soit juste, il est important d’utiliser le même critère de comparaison, c’est-à-dire la même norme (de sous-groupe) pour tous les individus. Pour ce faire, on utilise généralement la norme globale de la population générale adulte. Comme on peut supposer que les pilotes ont un niveau de performance élevé et qu’il est donc souhaitable d’avoir une bonne différenciation dans ce domaine (= pas d’effets de plafond), il serait encore mieux d’utiliser un échantillon de normes spécifiques comprenant des pilotes.

Comme le montrent ces trois exemples, les normes sont essentielles à l’interprétation des tests psychologiques. Leur utilisation et leur interprétation correcte ne sont toutefois pas aussi triviales qu’il n’y paraît à première vue. Si vous en êtes conscient, si vous connaissez les différences entre les types de normes et si vous choisissez soigneusement la norme appropriée en fonction de la question concrète, vous avez déjà fait beaucoup de choses correctement.


Glossar: Anfalls-, Quoten- und stratifizierte Stichproben = unterschiedliche Arten Normstichprobe zu erheben. Hierbei wird die Population in Subgruppen unterteilt und Personen zufällig (strat. Stichpr.) oder nicht zufällig (Quotenstichp.) rekrutiert. Anfallsstichproben verwenden hingegen keine Stratifizierung bzw. keinen Quotenplan und Personen werden einfach nach ihrer Verfügbarkeit rekrutiert. Standardabweichungen = statistischer Kennwert für das Ausmaß der Streuung der Testrohwerte um den Mittelwert innerhalb einer Stichprobe. Standardnormalverteilung = eine theoretische Verteilung von Werten, bei der sich die Werte in der Mitte anhäufen und an beiden Seiten symmetrisch abfallen. Boden-/Deckeneffekte = Bodeneffekte treten auf, wenn ein Test so schwierig ist, dass die meisten Personen nur sehr niedrige Testwerte erzielen. Umgekehrt spricht man von Deckeneffekten, wenn ein Test so leicht ist, dass die meisten Personen sehr hohe Testwerte erzielen. In beiden Fällen ist die Varianz der Testwerte innerhalb Normstichprobe eingeschränkt und führt dazu das im unteren (Bodeneffekt) bzw. im oberen Merkmalsbereich (Deckeneffekt) nicht gut differenziert werden kann.

Newsletter

Newsletter

Stay up to date on the latest tests, practical tips and tricks on subjects related to digital assessment or interesting offers for continuing professional development.