Deutsche HR-Abteilungen vertrauen bei ihren Entscheidungen zunehmend auf eignungsdiagnostische Verfahren für Personalauswahl, Personalentwicklung und Talent Management. Die Akzeptanz gegenüber Eignungstests wächst zwar, dennoch haben viele Anwender und Unternehmen weiterhin Zweifel an Güte und Messbarkeit eignungsdiagnostischer Instrumente. Was ist an diesen Vorbehalten dran?
Das Vergleichsportal PEATS erklärt, inwieweit die Wissenschaft vorhandene Zweifel entkräften kann und welche wissenschaftlichen Methoden und Kriterien hinter eignungsdiagnostischen Lösungen stehen.
Zweifel an Eignungstests
Die vorherrschenden Zweifel gegenüber Eignungstests beruhen vor allem auf der Frage, was ein Test eigentlich misst. Die tatsächlichen Merkmale einer Person oder doch eher ihre Fähigkeit zu liefern, was der potentielle Arbeitgeber mit dem Test hören möchte? Wie valide sind die Ergebnisse, die der Test ermittelt? Denn der Zusammenhang zwischen den teils weit hergeholt wirkenden Fragen im Test einerseits und Merkmalen wie der eigenen Teamfähigkeit oder Durchsetzungsstärke andererseits erschließt sich eben oft nicht gleich auf den ersten Blick. Natürlich zweifeln Menschen auch immer wieder daran, inwieweit ein Eignungstest die Vielfalt des Menschen und seiner Individualität gerecht wird.
Einwände und Zweifel beruhen einerseits auf privaten Erfahrungen, die viele Anwender mit unwissenschaftlichen “Psychotests” gemacht haben, zum Beispiel in einschlägigen Zeitschriften. Zum anderen gehen die Vorbehalte auf Tests zurück, die zwar im eignungsdiagnostischen Kontext tatsächlich gebraucht werden, aber den eigentlichen Anforderungen in der Praxis nicht gerecht werden können. Unter all den professionellen Angeboten des Marktes befinden sich auch unseriöse Anbieter, die mit geschickten Marketingstrategien versuchen, ihre Tools an den Personaler zu bringen. Doch trotz ihres kurzfristigen Erfolgs sind es mittelfristig genau diese Tools, die die Skepsis wachsen lassen.
Daran erkennen Sie wissenschaftliche Eignungstests
Wir brauchen also gewisse Anhaltspunkte, um die fundierten und seriösen Tools für die eigenen Personalprozesse erkennen zu können. Die Antwort lautet Wissenschaft. Wer für sein Talent Management ein eignungsdiagnostisches Tool etablieren möchte, sollte sich also immer an der Wissenschaftlichkeit eines Testverfahrens orientieren.
Doch was sind die wissenschaftlichen Kriterien und wann erfüllt ein Eignungstest oder Tool diese?
Zu den wichtigsten Kriterien gehören:
- Haupt- und Nebengütekriterien
- Statistische Modelle
- Eindeutigkeit und Genauigkeit
- Testmanual
Was jeweils unter den verschiedenen Kriterien zu verstehen ist, haben wir im Folgenden für Sie aufbereitet.
1. Kriterium: Der Eignungstest erfüllt die Hauptgütekriterien
Einwand: „Misst der Test überhaupt das, was er messen soll?“
Möchte man eine Antwort auf diese Frage erhalten, lohnt sich ein Blick auf die die Zahlen zu den drei Hauptgütekriterien eines wissenschaftlichen Tests:
- Objektivität
- Reliabilität
- Validität
Sie müssen für jeden Test mit Hilfe von statistischen Methoden einzeln nachgewiesen werden und bürgen für die wissenschaftliche Güte des Verfahrens. Ein Verfahren ist demnach wissenschaftlich solide, wenn der Eignungstest ein Merkmal unabhängig von äußeren Einflüssen (objektiv), zuverlässig (reliabel) und tatsächlich (valide) misst.
Die Zahlen zu den Gütekriterien erstrecken sich von 0,0 bis 1,0. Die 1 steht dabei für eine perfekte Erfüllung des Kriteriums: Der Test ist so objektiv, reliabel oder valide wie er nur sein kann. Umgekehrt sollte klar sein, was von einem Test mit Hauptgütekriterien in der Nähe von 0 zu halten ist.
Das wichtigste aller Gütekriterien ist dabei die Validität. Sie gibt an, ob der Test das misst, was er tatsächlich messen soll. Also ob beispielsweise ein Intelligenztest tatsächlich die kognitiven Fähigkeiten misst und nicht etwa Schulwissen oder Allgemeinbildung. Ist die Validität nicht erfüllt, ist der Test aus wissenschaftlicher Perspektive durchgefallen und damit auch für Anwendungen im eignungsdiagnostischen Kontext ungeeignet.
Nebengütekriterien
Je nach Kontext können Anwender zusätzlich erwarten, dass noch weitere Nebengütekriterien erfüllt sind. Zum Beispiel ist es für einen guten ersten Eindruck des Unternehmens wichtig, dass die Bewerber den verwendeten Eignungstest als angemessen und sinnvoll einschätzen. Wenn ein Bewerber im Test erkennt, worauf die Fragen abzielen - also den beruflichen Zusammenhang zwischen Fragen und Kompetenzen wahrnimmt - steigt die Bereitschaft, den Test wahrheitsgemäß auszufüllen. In der Testtheorie spricht man hier vom Gütekriterium der „Akzeptanz“.
Einige (weitere) mögliche Nebengütekriterien sind:
- Akzeptanz
- Fairness von Tests gegenüber Minderheitengruppen
- Positiver Kosten-Nutzen Aufwand des Testverfahrens
- Unverfälschbarkeit
Besonders der letzte Punkt ist unter dem Stichwort der „sozialen Erwünschtheit“ ein heiß diskutierter Aspekt in der Eignungsdiagnostik: Es ist nur verständlich, dass Personen einen Eignungstest bestmöglich ausfüllen möchten – also mit den Ergebnissen, die von ihnen erwartet werden.
Ein Test, der diese allzu menschlichen Tendenzen austrickst, erfüllt das Kriterium der Unverfälschbarkeit. Gelingen kann das zum Beispiel durch verschiedene Arten von Fragebögen mit unterschiedlichen Fragetechniken (Forced Choice, Multiple Choice, Likert-Skala). Auch gibt es die Möglichkeit, mittels spezieller Fangfragen (sogenannter „Bogus-Items“) einzuschätzen, wie genau es der Getestete mit der Wahrheit nimmt.
2. Kriterium: Der Eignungstest basiert auf statistischen Modellen
Einwand: „Zwischen den Fragen im Test und den untersuchten Merkmalen besteht kein Zusammenhang.”
Ein zentrales Kriterium für einen wissenschaftlichen Test ist seine Entwicklung anhand statistischer Modelle. Nur ein Test, der auf empirischen und mit Zahlen belegbaren Erkenntnissen beruht, verdient das Prädikat „wissenschaftlich“.
Bevor ein eignungsdiagnostisches Verfahren auf den Markt gelangt, muss es dafür eine Reihe empirischer Testläufe bestehen. Anhand der Testergebnisse von Stichproben, die der späteren Zielgruppe ähneln, wird der Test entwickelt, angepasst und optimiert. Dies kann bedeuten, dass einzelne, zu schwierige Fragen aus späteren Versionen des Tests fliegen. In der Statistik spricht man dabei von der sogenannten „Itemschwierigkeit“.
Weitere Analysen können zeigen, dass eine Frage gar nicht zu dem restlichen Test passt, weil sie ganz andere Dinge abfragt als ursprünglich geplant (“Trennschärfenanalyse”).
Die statistische Königsdisziplin bildet jedoch die sogenannte „Faktorenanalyse“. Mit diesem Verfahren erfahren Testkonstrukteure, welche Fragen tatsächlich dafür geeignet sind, um das interessierende Merkmal angemessen zu erfassen. Was zum Beispiel ein Item wie „Ich hinterlasse meinen Arbeitsplatz jeden Abend ordentlich und aufgeräumt“ mit einem Merkmal wie „Gewissenhaftigkeit“ zu tun hat, kann mit Hilfe einer Faktorenanalyse statistisch aufgezeigt werden.
Durch eine Vielzahl von Testläufen und statistischen Analysen werden so nach und nach die ungeeigneten Items bzw. Fragen entfernt. Das Ergebnis sind Tests mit Fragen, die sich unter dem kritischen Blick der prüfenden Statistik mehrmals bewährt haben. Fragen, die auch dann beibehalten werden, wenn sich dem Laien ihr Zusammenhang mit dem Messmerkmal nicht auf den ersten Blick erschließt.
3. Kriterium: Der Eignungstest ist eindeutig und genau
Einwand: „Jeder Mensch ist anders – ein Eignungstest kann das überhaupt nicht abbilden“
Je genauer wir unsere Mitmenschen betrachten, desto besser erkennen wir, wie unterschiedlich und einzigartig diese sind. Das Zusammenspiel von Eindeutigkeit und Genauigkeit ist es, was wissenschaftliche Tests ausmacht.
Funktionierende Wissenschaften zeichnen sich dadurch aus, dass ihre verwendeten Begriffe eindeutig definiert sind. Dies bildet die Grundlage für erfolgreiche Kommunikation und beugt Missverständnisse vor. In diesem Sinne muss auch einem wissenschaftlichen Eignungstest eine eindeutige Definition des berufsrelevanten Merkmals – sei es Intelligenz, Kontaktfähigkeit oder Führungsstärke - vorliegen, das gemessen werden soll.
Für die Testkonstrukteure bedeutet das, eindeutig festzulegen, wie das zu messende Merkmal zu verstehen ist und in welchen Aspekten es sich von ähnlichen Merkmalen unterscheidet. Dies kann beispielsweise bei einem Test für soziale Kompetenz damit einhergehen, die verschiedenen Facetten dieser Kompetenz zu definieren und klarzumachen, wo die Unterschiede zu einem Konstrukt wie „sozialer Intelligenz“ liegen.
Multidimensionale Testverfahren zur Erhebung mehrerer Merkmale
Mit einem multidimensionalen Test wird es möglich, einen Kandidaten auf verschiedenen Dimensionen zu beurteilen. Die Erhebung mehrerer Merkmale funktioniert aber nur, wenn die Merkmale präzise voneinander abgegrenzt und definiert sind.
Das Ergebnis ist ein mitunter sehr differenziertes Bild des Kandidaten, das sich aus seinen jeweiligen Ausprägungen auf den verschiedenen Skalen für z.B. Offenheit, Gewissenhaftigkeit und Extraversion (Big Five) zusammensetzt. Durch die unterschiedlichen Ausprägungen und deren Verhältnis zueinander entsteht eine Vielzahl möglicher Testergebnisse, die sich von Person zu Person nur selten exakt gleichen.
Das Kriterium der Eindeutigkeit schafft somit nicht nur Transparenz und Klarheit. Es bildet die Grundlage für differenzierte, genaue Kandidatenurteile. Durch diese Genauigkeit haben Tests in der Regel eine gute Chance, der Individualität eines Menschen gerecht zu werden. Ganz ohne Schubladen.
Das Testmanual: Angaben zur Wissenschaftlichkeit des Eignungstests
Das Testmanual stellt quasi die Urkunde all der genannten Kriterien des Eignungstests dar. Gemeint ist damit eine Broschüre, die alle wichtigen Angaben zur Wissenschaftlichkeit des Testverfahrens in nachvollziehbarer Form enthält.
Zum Beispiel Angaben darüber, wie das Testverfahren entstanden ist, es sich bisher empirisch bewährt hat oder korrekt in der Praxis anzuwenden ist. Wer wissenschaftlich arbeitet, hat nichts zu verbergen, sondern ist darum bemüht, diese Qualität auch transparent nach außen zu vermitteln.
Die Nicht-Existenz eines Testmanuals ist also ein recht zuverlässiges Ausschlusskriterium für unwissenschaftliche Testverfahren. Allerdings gilt der Umkehrschluss nicht, denn ein Testmanual garantiert nicht automatisch Wissenschaftlichkeit. Hier gilt es immer im Einzelfall zu prüfen, ob und auf welche Weise die oben genannten Kriterien erfüllt sind.
An oberster Stelle steht natürlich immer die weiterführende Frage, ob das Testverfahren überhaupt für die eigenen Zwecke geeignet ist.
Die häufig verbreiteten Einwände gegenüber Testverfahren sind nicht unbegründet, allerdings nur für bestimmte Arten von Tests angebracht. Die Wissenschaftlichkeit ist hier das Merkmal, anhand dessen Sie innerhalb des Angebots fundierte Testverfahren erkennen können.
Übrigens: Auf PEATS finden Sie nur Testverfahren, die die genannten wissenschaftlichen Kriterien erfüllen. Damit Sie ein Tool finden, das nicht nur wissenschaftlich, sondern auch für Ihren spezifischen Case ideal passt, möchten wir Sie unterstützen - mit einem Toolfinder, detaillierten Testinformationen und Kontaktkanälen zu den Anbietern. Mit PEATS finden Sie ein wissenschaftliches Tool, das bestmöglich zu Ihren Herausforderungen passt und Ihnen die Personalauswahl und die Personalentwicklung vereinfacht.
Bild: Helloquence, 2016