100 Jahre IQ – ein Grund zum Feiern
BLOG: Hochbegabung
Was ist Intelligenz? So ganz einig ist sich die Forschung bis heute nicht – fest steht aber, dass wir sie im Vergleich zu anderen psychologischen Merkmalen sehr gut messen können, und das ist doch auch schon mal was. In diesem Jahr feiert der Intelligenzquotient seinen 100. Geburtstag.
Die systematische Erfassung kognitiver Fähigkeiten begann sogar schon etwas eher – genau gesagt, vor 107 Jahren, als Alfred Binet vom französischen Bildungsministerium den Auftrag erhielt, ein Verfahren zu entwickeln, um Schulkinder mit besonderem Förderbedarf zu identifizieren. Der Förderbedarf bezog sich (und das setzt sich zum Leidwesen vieler Hochbegabter ja bis heute fort) auf diejenigen, die Schwierigkeiten hatten, dem Schulunterricht zu folgen. Ihnen sollte eine entsprechende Unterstützung zuteil werden, damit sie zumindest eine Grundbildung erreichen könnten.
Gemeinsam mit seinem Kollegen Théodore Simon machte sich Binet also ans Werk. Bereits deutlich früher hatte der Engländer Francis Galton (ein Cousin von Charles Darwin) versucht, Intelligenz mit Hilfe einfacher mentaler Operationen wie der Fähigkeit, zwischen Sinneseindrücken wie verschiedenen Helligkeitsstufen zu unterscheiden, oder der Reaktionsgeschwindigkeit zu erfassen. Für Binet und Simon, denen es ja um die Vorhersage des schulischen Erfolges ging, war diese Art der Erfassung dann doch etwas arg reduktionistisch. Stattdessen standen in ihrem Test Fähigkeiten im Vordergrund, die für die Bewältigung konkreter Alltagsprobleme von Bedeutung waren und die entsprechend – so würden es Pädagogen heute ausdrücken – einen starken lebensweltlichen Bezug hatten. Zeige mir Deine Nase! Wie heißen die Monate? Wozu benutzt man eine Gabel? Solche und ähnliche Aufgaben sind bis heute Teil von Intelligenztests, beispielsweise dem verbreiteten Wechsler-Intelligenztest für Kinder. Diese verschiedenen Aufgaben wurden nun von Binet und Simon nach Schwierigkeit gestaffelt. Aufgaben, die von 70 % aller Kinder eines Altersjahrgangs erfolgreich bewältigt werden konnten, wurden zu so genannten “Altersreihen” zusammengefasst, die dann wiederum eine Abschätzung des Intelligenzalters erlaubten. Wenn ein Kind alle Aufgaben seiner Altersstufe löst, entspricht das Intelligenzalter dem Lebensalter; löst es mehr, wird dies entsprechend verrechnet.
Binet selbst war eher zurückhaltend, das Testergebnis auf eine Zahl zu reduzieren, da der selben Summe an gelösten Aufgaben ganz unterschiedliche qualitative Muster zu Grunde liegen können.1 Dieses Manko ist bis heute in den meisten handelsüblichen Tests nicht zufriedenstellend gelöst – Punktsummen lassen sich nun mal einfach berechnen und normieren. Ein weiteres Problem mit Binets “Intelligenzalter” war jedoch, dass Diskrepanzen zwischen Intelligenz- und Lebensalter je nach Alter des Kindes etwas ganz anderes bedeuten können. Ein Vierjähriger auf dem Stand eines Sechsjährigen ist in seiner kognitiven Entwicklung deutlich weiter als ein Zehnjähriger auf dem Niveau eines Zwölfjährigen. Und hier kommt nun unser Geburtstagskind ins Spiel: Denn genau, um dieses Problem zu lösen, schlug William Stern 1912 vor, das Intelligenzalter doch einfach am Lebensalter zu relativieren (und diesen Quotienten zur leichteren Handhabbarkeit dann noch einmal mit 100 zu multiplizieren) – der IQ war erfunden!
Leider waren aber auch damit nicht alle Probleme gelöst. Bei Kindern lässt sich noch halbwegs bestimmen, welche Fertigkeiten in einem bestimmten Alter beherrscht werden sollten; bei Jugendlichen und Erwachsenen hingegen, die sich im Rahmen ihrer beruflichen Ausbildungen deutlich stärker spezialisieren, lässt sich kaum noch sagen, welche “allgemeinen” Dinge jemand können muss. Abgesehen davon wird auch die Differenzierung immer schwieriger. Was unterscheidet einen 34jährigen von einem 35jährigen? Aus diesem Grund brachte David Wechsler dann den Abweichungs-IQ ins Spiel – der den “Quotienten” nur noch aus Gründen der Tradition im Namen trägt, aber eigentlich keiner mehr ist. Wechsler ging nämlich von der so genannten Rohwerteverteilung aus, die einer Normalverteilung ähnelt. Die meisten Leute erreichen Werte im mittleren Bereich, an den Extremen wird die Verteilung dann dünner. Eine solche Verteilung lässt sich nun beschreiben durch (1) den Mittelwert: Dieser wurde – ganz traditionsgemäß im Einklang mit Sterns Intelligenzquotienten – auf 100 festgelegt; (2) die Standardabweichung: Diese ist im Wesentlichen ein Maß dafür, wie breit die Verteilung auseinanderläuft bzw. wie spitz sie ist. Die in Deutschland gängige IQ-Verteilung hat eine Standardabweichung von 15 (und wer jetzt die IQ > 130 = Hochbegabung im Kopf hatte, kann auch messerscharf schlussfolgern, wie die 130 zustande gekommen ist: nämlich dadurch, dass zwei Standardabweichungen über dem Mittelwert als hinreichend überdurchschnittlich gelten können).
Damit eine solche Verteilung auch aussagekräftig ist, braucht man eine große (und repräsentative) Vergleichsgruppe, an der man einen individuell erreichten Wert messen kann. Insbesondere, um an den Extremen hinreichend zu differenzieren, braucht man genug Leute, die einen so extremen Wert auch erreichen; da diese statistisch ja eher selten sind, muss die Grundgesamtheit entsprechend groß sein. Darin liegt auch das Problem begründet, dass die meisten Intelligenztests überhaupt nur bis etwa zu einem IQ von 140-150 messen (und in diesen Bereichen auch nicht mehr sehr genau). Statistisch betrachtet haben 0,13 % der Bevölkerung einen IQ von 145 und darüber; bei einer nicht unüblichen Normierungsstichprobe von 1000 Personen hat man also vielleicht eine oder zwei Personen dabei, die einen entsprechenden Wert überhaupt erreichen!
Wie erklären sich aber dann die teilweise astronomischen Werte, die Höchstbegabten zugeschrieben werden? Zum einen muss auch hier natürlich die Standardabweichung beachtet werden. Manche Tests, etwa die Cattell-Skala, haben eine Standardabweichung von 24; ein mit einem solchen Test erreichter beeindruckender IQ von 148 entspräche, transformiert in die gängige Verteilung mit einer Standardabweichung von 15, jedoch gerade mal einem IQ von 130. Zum zweiten werden in der Höchstbegabtenforschung mangels besserer Alternativen auch noch die frühen Weiterentwicklungen des klassischen IQ-Konzepts (etwa die älteren Stanford-Binet-Skalen) verwendet. Erreicht ein Kind also ein Intelligenzalter, das doppelt so hoch ist wie sein Lebensalter, ergibt sich daraus rein rechnerisch ein IQ von 200. Da sich jedoch, wie oben skizziert, nicht für jedes Lebensalter entsprechende Intelligenzalter-Aufgaben finden lassen, wird es ab der späten Kindheit schwierig, eine solche Höchstbegabung mit gängigen Testverfahren zu diagnostizieren. Erwachsene Höchstbegabte müssen sich daher mit relativ ungenauen Angaben wie beispielsweise “IQ > 150” zufrieden geben – möglicherweise ist es in solchen Bereichen aber auch gar nicht mehr so praktisch relevant, ob der tatsächliche IQ nun bei 153 oder bei 160 liegt …
1 Dies beeinflusste möglicherweise auch Binets berühmtesten Schüler, Jean Piaget, der seinen Fokus bei der Erforschung der kognitiven Entwicklung von Kindern insbesondere auf die qualitativen Fortschritte legte.
Literatur:
- Mackintosh, N. J. (2011). History of theories and measurement of intelligence. In R. J. Sternberg & S. B. Kaufman (Eds.), The Cambridge Handbook of Intelligence (pp. 3–19). Cambridge: Cambridge University Press.
- Urbina, S. (2011). Tests of intelligence. In R. J. Sternberg & S. B. Kaufman (Eds.), The Cambridge Handbook of Intelligence (pp. 20–38). Cambridge: Cambridge University Press.
IQ prüft also Schulerfolg
Interessanter Beitrag. Der IQ-Test wurde also für die Schule entworfen und hat dort weiterhin seine grösste Bedeutung.
Die Erfinder haben sich zwar Gedanken zur Art der Testaufgaben gemacht, allerdings scheint sie die statistische Auswertung und Fragen der Normierung (z.B. IQ 100 als altersunabhängiges im Mittel zu erwartendes Abschneiden). mehr beschäftigt zu haben.
Die eigentlich interessanten Fragen wurden zum Zeitpunkt der Erfindung wahrscheinlich noch kaum gestellt, ging es doch zuerst nur darum, die schlechtesten Schüler herauszudiskriminieren, um sie dann fördern zu können. Interessante Fragen wären z.B.
1) wie muss ein Intelligenztest beschaffen sein um die kognitive Leistungsfähigkeit möglichst unabhängig von der Bildung und vom kulturellen Hintergrund bestimmen zu können
2) Gibt es hochsignifikante Tests für bestimmte Teilfähigkeiten (z.B. logisches Denken, Fähigkeit zu planen usw.)
3) Was sagt der Intelligenztest über den kurz- mittel- und langfristigen “Erfolg” des Probanden aus.
Diese Fragen sind inzwischen genauer unter die Lupe genommen. Wirklich klar beantwortet sind sie aber wahrscheinlich immer noch nicht.
Eigentlich bin ich überrascht, dass es inzwischen nicht “modernere” Verfahren gibt um die intellektuelle Leistungsfähigkeit zu bestimmten. Man sollte doch erwarten, dass encephalographische Verfahren oder die neuen bildgeberischen Methoden, die den Hirnstoffwechsel widergeben, auch etwas über die Intelligenz aussagen können. Einerseits gilt wohl, dass diese neuen Wissenschaften wie Neuroscience/Neurobiology und auch die neuen instrumentellen Messverfahren erst so richtig in die Gänge kommen
und andererseits messen Testfragen sehr konkret und (unanfechtbar) die Problemlösefähigkeiten eines Menschen. Vielleicht zeigt sich wirklich erst in der konkreten Situation ob es jemand drauf hat oder nicht und ein kluges Gesicht kann wohl zutiefst täuschen sogar “Menschenkenner”, denen angeblich schon ein Händedruck und ein Blick ins Gesicht für weitgehende Diagnosen und Prognosen genügt.
?
Verstehe ich das richtig? Man weiß nicht so recht, was Intelligenz ist, aber messen kann man sie genau?
Glückwunsch,
aber was spricht denn jetzt für die Annahme einer eigenen Kategorie “Hochbegabung”, wo die Intelligenzmessung doch nur graduelle Unterschiede zeigt. Und wie lässt sich ein kritischer Grad zwischen “begabt” und “hochbegabt” trotz Flynn-Effekt rechtfertigen? (Man stelle sich eine Zeitreise “Begabter” in die Vergangenheit vor, in der sie dann “Hochbegabte” wären.) Besondere Gene bei konstant 2% aller Populationen aller Zeiten?
(Leicht verspätete) Antworten …
… ich gehe die Kommentare einfach mal von hinten nach vorne durch!
@Franz Hals: Im Grunde haben Sie’s genau erfasst: Wenn man Hochbegabung über den IQ definiert (was u.a. deshalb so gängig ist und gerne genommen wird, weil es eben so ein schön messbares Kriterium ist), ist die Definition in der Tat willkürlich. Manche Hochbegabungsforscher sagen auch, dass sie im Grunde nur Intelligenzforschung auf hohem Niveau machen würden 😉 Das 130er-Kriterium ist ja letztlich auch nur statistisch bedingt (2 Standardabweichungen = klar über dem Mittelwert) und somit mehr oder weniger willkürlich gesetzt.
@ D. Müller: Etwas überspitzt, ja 😉 Die allumfassende Definition, auf die sich alle einigen könnten, gibt es bislang in der Tat nicht, weil Schwerpunkte anders gesetzt, Ergebnisse unterschiedlich interpretiert werden können. Für die Messung gibt es diverse Gütekriterien (in der Klassischen Testtheorie etwa die heilige Dreifaltigkeit aus Objektivität, Reliabilität und Validität), die lassen sich dann aus den richtig gelösten Aufgaben recht unkompliziert berechnen — und da schneiden die IQ-Tests deutlich besser ab als Tests anderer Merkmale.
@Martin Holzherr: Das mit der Kulturabhängigkeit wurde durchaus versucht, indem Aufgabenmaterial gewählt wurde, das allen Teilnehmern einigermaßen unbekannt sein sollte (etwa figurale Inhalte — heute sind die allerdings auch nicht mehr so unbekannt) und mentale Operationen messen sollte, die wenig von Bildung beeinflusst sein sollten — etwa logisches Schlussfolgern, ein Bereich der so genannten fluiden Intelligenz (das ist nach einem psychologischen Modell der angeborene Teil der Intelligenz). So ganz funktioniert es nicht, weil ja auch Aspekte wie Instruktionsverständnis, Vertrautheit mit Testsituationen, Konzentrationsfähigkeit, Entspanntheit im Umgang mit Autoritäten etc. dazukommen, die das Ergebnis beeinflussen — der Test selbst ist also nur eine von vielen Variablen.
Zur Erfassung von Teilfähigkeiten: Da gibt es ein ganz schönes Modell, das Berliner Intelligenzstrukturmodell (basierend auf tausenden von IQ-Testaufgaben), welches verschiedene kognitive Operationen und Inhaltsbereiche differenziert und insgesamt auf 12 distinkte Facetten kommt. Die jeweiligen Subtests funktionieren recht gut; allerdings muss ein Teiltest auch lang genug sein (mit 10 Aufgaben wird es schwierig, Intelligenzquotienten zwischen, sagen wir, 60 und 140 genau zu differenzieren) -> abgesehen davon, dass auch die Länge den Test, speziell die Reliabilität, verbessert. (Ich schweife ab.)
Zum Zusammenhang zwischen IQ und Erfolg gibt es tolle Längsschnittstudien und Übersichtsartikel — in den 1990ern wurde von Neisser und Kollegen mal im Zuge der Bell-Curve-Debatte zusammengestellt, was wir an gesicherten Kenntnissen über die Intelligenz haben. Sollte sich im Netz finden (glaube, der ist sogar bei Wikipedia verlinkt).
Der Ansatz mit der, ich nenn’s mal, biologischen Basis war ja einer der ersten Versuche, kognitive Fähigkeiten überhaupt zu erfassen — schon vor dem IQ. Galton hat da viele Versuche gemacht, von Reaktionsschnelligkeit über Reizdiskrimination und vielen anderen “elementaren kognitiven Funktionen”. Direkt am Neuron zu messen stelle ich mir schwierig vor — Intelligenz ist ja nicht nur eine lokale Aktivität, sondern ja gerade eine Integrationsleistung des Gehirns, die ja nicht nur lokal, sondern vernetzt stattfindet (und sich darüber hinaus ja auch die Gehirne aufgrund unterschiedlicher Lerngeschichten etc. sehr stark unterscheiden — das, was man so schön als bunte Bilder zu sehen bekommt, ist in der Realität ja auch aus vielen Probanden “integriert”). Aber ich könnte mir vorstellen, dass da noch vieles entwickelt werden wird!
Klassischer IQ Wechsler-IQ
Ich hab mal gelesen, die Häufigkeitsverteilung des klassischen IQ (100*Intelligenzalter/Alter) entspreche eher einer Lognormalverteilung als Normalverteilung. Genauer: Der natürliche Logarithmus des klassischen IQ bei Kindern sei näherungsweise normalverteilt mit Mittelwert ln(100) = 4.605 und Standardabweichung 0.15.
Für IQ-Werte um 100 macht das praktisch kaum einen Unterschied, für höhere Werte dagegen schon. Ein Kind mit einem klassischen IQ von 200 liegt demnach “nur” (ln(200)-ln(100))/0.15 = 4.62 Standardabweichungen über der Norm, was einem Wechsler-IQ von 169 entspricht und immerhin von einem Kind unter 520’000 Kindern erreicht wird.
Ein klassischer IQ von 130 entspricht dann einem Wechsler-IQ von 126 und tritt somit bei etwa 4% aller Kinder auf.
Entspricht das der beobachteten tatsächlichen Häufigkeit von hochintelligenten Kindern?
IQ Glockenkurve falsch
Eine empirische Studie über Lestungsverteilungen (von Physikprofs bis zu Sportlern) zeigt, dass das naive Verteilungsmodel so nicht stimmt:
Ernest O’Boyle and Herman Aguinis, The best and the rest: revisiting the norm of normality of individual performance, Personnel Psychology 65 (2012), 79–119. http://onlinelibrary.wiley.com/doi/10.1111/j.1744-6570.2011.01239.x/fullÿ
http://www.npr.org/2012/05/03/151860154/put-away-the-bell-curve-most-of-us-arent-average?ps=cprs
Wer viel misst, misst Mist
Es handelt sich um eine gut verständliche Darstellung der Geschichte und einer Auswahl der recht zahlreichen Schwierigkeiten testbasierter Intelligenzmessung. Bei Probanden im Kindesalter kommt noch die Abhängigkeit der Messergebnisse von den emotionalen Rahmenbedingungen hinzu. Gar zu schnell gerät der Leistungstest eines Kindes zum Stresstest. Ein schlechte Mathenote oder ein niedriger IQ spiegeln dann nur wieder, dass das Kind sich mit dem Lehrer bzw. dem Testleiter unwohl gefühlt hat. Geschulte Lehrer oder Testleiter sollten das erkennen – aber davon kann natürlich nur in einer Minderzahl der Fälle ausgegangen werden.
Solche Faktoren, so bedeutsam deren Rolle in der Intelligenz- und Leistungsmessung auch sein mag, lassen sich nicht linearisieren, nicht herausrechnen. Drum finden sie in der Testsystematik auch keine Beachtung. Wer viele IQ-Tests mit Kindern durchgeführt hat, weiß jedoch um deren große Bedeutung. Angesichts des überwiegend selektiven Einsatzes von Intelligenztests spielt das letztendlich keine allzu große Rolle. Denn zu viele niedrige Ergebnisse rufen bei Lehrern und Eltern erfahrungsgemäß weniger Misstrauen hervor als zu viele hohe.
@Thorsten Kerbs
Hallo Herr Kerbs,
dass das Problem so gar keine Berücksichtigung fände, tut den KollegInnen, die solche Tests verfassen, aber ein Stück weit unrecht! Das Problem der Testleiter-Kind-Interaktion und des Rapports wird in den Manualen des WISC-IV (früher HAWIK-IV, nur der Name ist neu) und des wppsi-iii explizit angesprochen — und auch die damit einhergehenden Schwierigkeiten der Interpretation. In früheren Fassungen wurde darauf aber in der Tat kaum eingegangen. Gut, dass das Problem so langsam erkannt wird und zumindest Versuche unternommen werden, diesen Fehler, dessen Höhe sich kaum empirisch ermitteln ließe (dazu bräuchte man dann wiederum weiterführende Informationen zu Angstindikatoren o.ä.), zumindest durch eine kindgemäße Testdurchführung möglichst klein zu halten 🙂 Denn dass diese Faktoren berücksichtigt werden müssen — keine Frage, da stimme ich Ihnen uneingeschränkt zu.
Viele Grüße
Tanja Gabriele Baudson
Es steht ganz zweifelsfrei fest das ein Intelligenztest nur dann wirklich aussagekräftig ist wenn er auch richtig ausgewählt wurde. Außerdem ist es auch nicht einfach diesen richtig auszuwerten und die Ergebnisse zu interpretieren. Viele Eltern suchen im Internet beispielsweise nach IQ-Tests für Kinder um einen Schnelltest durchzuführen. Solche Tests sind aber in der Regel extrem ungenau da sie keinesfalls an das eigene Kind angepasst sind. Je nach Alter, Geschlecht und Schulbildung müssen ganz individuelle Tests durchgeführt werden wobei wiederum nur ein erfahrener Fachmann weiß welcher Test der richtige ist.
@Klara und allgemein
Ich finde es geradezu erschreckend, dass es im Internet Intelligenztests für Kinder gibt, welche die Eltern dann offenbar mal eben so durchführen können. Ich bekomme von zahlreichen Eltern in meinem Bekanntenkreis mit, dass diese sich extrem schnell von allen möglichen Tipps und Ratschlägen aus Elternzeitschriften und dem Internet verunsichern lassen – finde ich problematisch. Ein solcher Intelligenztest fällt für mich in die Kategorie „Verunsicherung“. Intelligenz ist doch sowieso extrem schwer zu messen. Ich finde, der Aspekt der emotionalen Intelligenz, des Sich-Einfühlens in andere, bleibt doch vermutlich auch eher außen vor. Oder ein anderes Beispiel: Könnte man den Schreibstil beispielsweise als einen Indikator für Intelligenz heranziehen? Ich lektoriere Texte und habe da schon sehr grenzwertige Formulierungen gelesen. Der wissenschaftliche Gehalt der Arbeiten war trotzdem hochwertig und wurde auch dementsprechend bewertet.