Liebe Leserinnen und Leser,
die Auswahl des passenden Personals ist für die Funktionsfähigkeit der Behörden und Verwaltungen von wesentlicher Bedeutung. Bei Stellenbesetzungs- und Auswahlverfahren ist Art. 33, Abs. 2 des Grundgesetzes zu beachten, mit dem die Anforderungen Eignung, Befähigung und fachliche Leistung an die Vergabe öffentlicher Ämter festgelegt sind.
Monokultur dienstlicher Beurteilungen
Angesichts der Rechtsprechung u. a. des Bundesverfassungsgerichts und des Bundesverwaltungsgerichts nehmen derzeit dienstliche Beurteilungen eine herausragende Rolle bei Stellenbesetzungs- und Auswahlverfahren ein (z. B. Gourmelon & Hoffmann, 2017, S. 2). Bei der Auswahlentscheidung ist – sofern ein Beamter /eine Beamtin sich beworben hat – nach der Rechtsprechung stets das Ergebnis der dienstlichen Beurteilung das ausschlaggebende Auswahlkriterium. Die Ergebnisse weiterer eignungsdiagnostischer Verfahren wie beispielsweise Interviews, Tests oder Assessment Center sind nur dann entscheidend, sofern sich hinsichtlich der dienstlichen Beurteilung ein Gleichstand zwischen den Kandidaten ergibt. In der Praxis wird die herausragende Bedeutung dienstlicher Beurteilungen bei Auswahlverfahren oftmals kritisiert. Einige Kritikpunkte an der ausschließlichen Verwendung dienstlicher Beurteilungen sind:
Beurteilungsergebnisse sind verzerrt
Dienstliche Beurteilungen spiegeln nicht die tatsächliche Leistung und Eignung des Beamten wider. Beurteilungsergebnisse werden durch Stereotype, Sympathien, andere Beurteilungsfehler, Quotenregelungen, aber auch durch mikropolitische Erwägungen des Beurteilers verzerrt. Daneben können auch mangelnde Erfahrung und Ausbildung für den Beurteilungsprozess oder große Führungsspannen zu nicht zutreffenden Ergebnissen führen. Für vielfältige Personengruppen, wie beispielsweise Personalräte, Beamte in Elternzeit oder Sonderurlaub müssen dienstliche Beurteilungen nachgezeichnet (vulgo: ausgedacht) werden. Scullen, Mount und Goff (2000, S. 956 ff) gelangen mit einer empirischen Studie zu der Erkenntnis, dass Vorgesetzte sich in ihrem Urteil über Mitarbeiter im Mittel nur zu etwa 30 % auf Leistungseindrücke beziehen, der Einfluss von Beurteilungsfehlern beträgt nach ihrer Einschätzung 40 bis 50 %. Beurteilungsergebnisse sind folglich relativ stark von „… Einflussgrößen bestimmt, die sich nicht auf Leistungsaspekte beziehen“ (Scherm, 2013, S. 740).
Beurteilungsergebnisse sind nicht generalisierbar
Die Erkenntnisse aus dienstlichen Beurteilungen sind meist nicht auf andere berufliche Situationen generalisierbar. So werden die in einer Stelle gezeigten Leistungen eines Beamten u. a. geprägt durch die spezifischen Aufgaben der aktuellen Stelle, der konkreten Organisation der Aufgabenbearbeitung sowie durch das spezielle Führungsverhalten des einzelnen Vorgesetzten. Wer mit der Aufgabe A beim Vorgesetzten X eine mittelmäßige Leistung erbringt, kann mit der Aufgabe B beim Vorsetzten Y durchaus eine hohe Leistung erbringen.
Widersinnige Vergleiche
Es muss miteinander verglichen werden, was oftmals nicht vergleichbar ist. Dies trifft z. B. für den Fall zu, dass dienstliche Beurteilungen unterschiedlicher Systematik aber auch Arbeitszeugnisse von Kandidaten aus der Privatwirtschaft mit Beurteilungsergebnissen von Beamten miteinander verglichen werden müssen.
Beurteilungsergebnisse lückenhaft
Dienstliche Beurteilungen sind nicht in dem Sinne umfassend, dass mit diesen valide Erkenntnisse über alle bedeutsamen Eignungsmerkmale erfasst werden. So kann der beurteilte Beamte stets nur Leistungen und Eignungsmerkmale in Bezug auf eine konkrete Tätigkeit / Stelle zeigen. Ob der Beamte darüber hinaus Potenziale für andere Tätigkeiten hat (z. B. Führungstätigkeiten, Lehrtätigkeiten, beratende Tätigkeiten), kann der Vorgesetzte nur sehr eingeschränkt beobachten und damit beurteilen.
Bestenauslese vernachlässigt
Die Beurteilung durch den Vorgesetzten stellt nur eine Erkenntnisquelle über Eignungsmerkmale der Beamten dar. Durch Vernachlässigung weiterer möglicher Erkenntnisquellen, wie beispielsweise Arbeitsproben, psychologische Testverfahren, Interviews, wird das Prinzip der Bestenauslese nicht vollständig realisiert.
Vorgesetztenurteile auf dem Prüfstand
Ob der alleinige Einsatz dienstlicher Beurteilungen in Auswahlverfahren zielführend ist, hängt entscheidend auch davon ab, ob mit Beurteilungsergebnissen auch tatsächlich die am besten geeigneten Kandidaten ausgewählt werden. Hierzu liefert die Studie von Thus und Remke (2019) erste Erkenntnisse. Zweck der Studie war es, das Auswahlverfahren für den gehobenen Dienst der Polizei Sachsen zu evaluieren. Es konnten die Daten von 69 Seiteneinsteigern (Abiturienten ohne vorherige Tätigkeit bei der Polizei) und von 129 Aufsteigern (Beamte aus dem mittleren Dienst der sächsischen Polizei) ausgewertet werden. Im Weiteren wird nur auf die Erkenntnisse über die Aufsteiger eingegangen.
Analysierte Daten
Das Auswahlverfahren bestand unter anderem aus folgenden Elementen, mit denen die späteren beruflichen Leistungen vorhergesagt werden sollten:
Über die dann ausgewählten Aufsteiger lagen u. a. folgende Daten vor:
Mit der Laufbahnprüfungsnote und der Fremdeinschätzung liegen Erkenntnisse über die vorherzusagenden Leistungen der ehemaligen Bewerber vor.
Statistische Ergebnisse
Thus und Remke (2019) ermittelten die statistischen Zusammenhänge zwischen den Daten des Auswahlverfahrens einerseits und den späteren Leistungsdaten andererseits. Als Maß für die Enge des statistischen Zusammenhangs verwendeten sie den Korrelationskoeffizienten r, der Werte zwischen -1 und +1 annehmen kann. Ein r von +1 bedeutet, dass zwei Variablen extrem eng miteinander zusammenhängen (schlägt die eine Variable in eine Richtung aus, schlägt auch die andere Variable in dieselbe Richtung ; r = -1: die andere Variable schlägt in die andere Richtung aus), ein Wert von r = 0 bedeutet, dass die beiden Variablen überhaupt nicht miteinander zusammenhängen. Tabelle 1 enthält die Ergebnisse der Zusammenhangsanalyse.
Laufbahnprüfungsnote | Fremdeinschätzung durch Vorg. | |
Aufstiegseignungsprognose | r = 0,18* | r = 0,03 |
strukt. Interview | r = 0,05 | r = 0,14 |
Situational Judgement Test | r = 0,17* | k. A. |
Tabelle 1: Statistische Zusammenhänge zwischen Elementen des Auswahlverfahren und der späteren beruflichen Leistung (nach Daten von Thus & Remke, 2019 sowie Remke, 2019). Die mit einem Stern* gekennzeichneten Korrelationen sind statistisch signifikant.
Interpretation der Ergebnisse
Was bedeuten die statistischen Ergebnisse? Es ist festzustellen, dass mit den angegebenen Elementen des Auswahlverfahrens die späteren beruflichen Leistungen nur mäßig gut vorhergesagt werden können (das klappt übrigens bei den Seiteneinsteigern deutlich besser). Das gilt sowohl für die AEP als auch für die eignungsdiagnostisch fundierten Verfahren. Im Vergleich zeigt sich, dass die Laufbahnprüfungsnote durch den psychologischen Test genauso gut vorhergesagt werden kann, wie durch die AEP, die einem Beurteilungsergebnis ähnelt. Quasi kein Zusammenhang zeigt sich zwischen der AEP und der Fremdeinschätzung durch den späteren Vorgesetzten. Das bedeutet: die Vorgesetzten, die die Polizisten im mittleren Dienst beobachtet und beurteilt hatten, konnten deren Leistung im gehobenen Dienst der Polizei Sachsen nicht vorhersagen.
Schlussfolgerung
Die oben beschriebene herausragende Rolle von dienstlichen Beurteilungen in Auswahlverfahren ist aus wissenschaftlicher Sicht nur dann zu rechtfertigen, sofern mit Beurteilungsergebnissen tatsächlich die zukünftigen Leistungen von Kandidaten vorhersagt werden können. Die vorliegenden Daten bieten hierfür keinen Beleg. Solange keine Evidenz für die Vorhersagegüte von Beurteilungsergebnissen vorliegt, sollten zur Gewährleistung der Bestenauslese in Stellenbesetzungs- und Auswahlverfahren sowohl die Daten aus dienstlichen Beurteilungen als auch anderer eignungsdiagnostischer Verfahren zur Prognose späterer beruflicher Leistung und Eignung herangezogen werden.
Herzlichst
Ihr Andreas Gourmelon
Quellen:
Gourmelon, A. & Hoffmann, B. (2017). Stellenbesetzungs- und Auswahlverfahren treff- und rechtssicher gestalten. Heidelberg: Rehm.
Scherm, M. (2013). Fremdurteile. In W. Sarges (Hrsg.), Management-Diagnostik, S. 734 – 741. Göttingen: Hogrefe.
Scullen, S. E., Mount, M. K. & Goff, M. (2000). Understanding the latent structure of job performance ratings. Journal of Applied Psychology, 88, pp. 50 – 66.
Remke, S. (2019). Persönliche Mitteilung vom 26. März 2019.
Thus, S. & Remke, S. (2019). Die evaluationsbasierte Optimierung des Auswahlverfahrens für den gehobenen Dienst der Polizei Sachsen. Polizei & Wissenschaft, 4/2019, 102 – 115.
Gerne können Sie auch unser Kontaktformular benutzen und wir melden uns bei Ihnen.
Kontaktformular