Fachartikel · Edition VIII · Skills of the Future

Verhaltensanker statt Skill-Schlagwort: wie man Future-Skills im Bewerbungsgespraech wirklich erkennt.

Von Michael von Hirschfeld · 11. Juni 2026 · ~14 Minuten Lesezeit
Zuletzt aktualisiert: 11. Juni 2026

1Das Skill-Label im Interview

Eine HR-Direktorin sitzt im zweiten Interview einer Schluesselbesetzung. Auf dem Tisch liegt der Lebenslauf einer Kandidatin, im Skill-Profil steht ein Wort: „Change Management". Die Kandidatin nickt freundlich, als die Bereichsleitung danach fragt. Sie erzaehlt von einem Projekt vor drei Jahren, mit dem Wort „transformativ" und mit zwei Tool-Namen. Die HR-Direktorin schreibt sich „passt" hinter den Skill und weiss in der naechsten Sekunde, dass sie nichts gepruft hat.

Diese Szene laesst sich beliebig wiederholen. Mit dem Label „Strategische Entscheidungs-Faehigkeit". Mit „Daten-Storytelling". Mit „AI-Kollaboration". Im Briefing steht ein Skill-Name, im Interview taucht eine Geschichte auf, und am Ende des Tages sitzt im Bewertungs-Bogen ein Kreuz hinter einer Zeile, von der niemand sagen koennte, was sie eigentlich abfragt. Wer im Vier-Augen-Gespraech ehrlich ist, gibt das zu. Die meisten Recruiting-Prozesse leben damit, weil ihnen die Sprache fehlt, es anders zu machen.

„Ein Skill-Label ist nicht beobachtbar. Verhalten ist beobachtbar. Alles, was dazwischen liegt, ist Annahme."

Diese Annahmen sind teuer. Eine Schluesselbesetzung im Mittelstand kostet, je nach Funktion und Gehalt, zwischen 80.000 und 250.000 Euro vom Auftrag bis zum unterschriebenen Vertrag. Wer auf der Basis eines Skill-Labels entscheidet, das niemand auf Verhalten heruntergebrochen hat, wettet das Investment auf eine semantische Naehe zwischen zwei Woertern: das im Briefing und das im Lebenslauf. Beide bedeuten dann oft nicht dasselbe.

Die Loesung ist alt und gut belegt. Sie heisst Verhaltensanker, in der Fachsprache Behavioural Anchored Rating Scales, abgekuerzt BARS. Sie geht auf die industrielle Psychologie der 1960er und 1970er Jahre zurueck und ist seitdem in akademischer Forschung und kommerziellen Bewertungsverfahren so weit etabliert, dass keine ernsthafte Diskussion mehr darum gefuehrt werden muss, ob die Methode funktioniert. Die ernsthafte Diskussion betrifft, warum sie im deutschen Mittelstand noch immer so selten im Interview ankommt - und wie sich das aendert.

2Was Verhaltensanker methodisch sind

Ein Verhaltensanker ist die Beschreibung eines beobachtbaren Verhaltens in einer konkreten Situation. Drei Bestandteile machen ihn aus: eine Situation, eine Handlung, eine Beobachtbarkeit. Wer einen dieser drei Bestandteile weglaesst, hat keinen Anker, sondern eine Bewertung.

Die Methode geht auf die fruehe Competency-Bewegung zurueck. David McClelland hat 1973 im American Psychologist argumentiert, dass schulische Noten und klassische Intelligenztests den Berufserfolg schlechter vorhersagen als die Beobachtung konkreter Verhaltensweisen am Arbeitsplatz - ein Aufsatz, der die akademische und industrielle Personaldiagnostik fuer Jahrzehnte praegte und in den Klassikern der Folgejahre als Begruendung des Competency-Ansatzes referenziert wird.1 Richard Boyatzis hat 1982 mit „The Competent Manager" auf Basis einer Untersuchung von rund 2.000 Managerinnen und Managern in 41 verschiedenen Rollen ein Kompetenz-Modell publiziert, das fast jede heutige BARS-Anwendung methodisch traegt: 19 Kompetenzen in vier Clustern, jede mit konkreten Verhaltensbeschreibungen unterlegt.2

Was BARS technisch unterscheidet: Statt einer Skala wie „sehr gut, gut, befriedigend, schlecht" wird jede Stufe einer Skala mit einem konkret beobachtbaren Verhalten verankert. Statt zu fragen „Wie gut kann diese Person AI-Kollaboration?" wird gefragt „Welches der vier hier aufgefuehrten Verhalten beobachten wir im Gespraech?". Die Frage wandert von der Bewertung zur Beobachtung. Das ist die kleine, harte Verschiebung, an der die Methode haengt.

Die psychometrische Forschung der vergangenen 40 Jahre hat fuer BARS bessere Inter-Rater-Reliabilitaet, geringeren Halo-Effekt und geringere Leniency-Fehler nachgewiesen als fuer rein numerische Skalen. Das gilt nicht nur in der akademischen Literatur, sondern auch in Validierungs-Studien aus Hochschulmedizin, Lehr-Effektivitaets-Forschung und industrieller Personaldiagnostik.3 Auch SHL hat das Verfahren in seinem Universal Competency Framework systematisch fuer Recruiting verfuegbar gemacht: pro Kompetenz liefert SHL „behavioural anchors", Interview-Fragen, Assessment-Aufgaben und Entwicklungs-Hinweise.4 DDI arbeitet im Leadership-Readiness-Assessment mit demselben Grundgedanken. Talent Q, Korn Ferry, Lominger - sie alle bauen Bewertungs-Architekturen, in denen Verhaltensanker die tragende Schicht sind.

Im Mittelstand kommt die Methode trotzdem selten an. Der Grund ist nicht akademisch. Der Grund ist Aufwand. Verhaltensanker zu formulieren kostet Zeit, weil pro Skill mehrere Stakeholder ihre Beobachtungs-Erwartung aushandeln muessen. Wer sie nicht aushandelt, hat keinen Anker, sondern eine Geschmacks-Aeusserung. Wer sie aushandelt, hat das Gegenmittel zum Bauchgefuehl.

3Drei Skills, neun Anker

Wie sieht das konkret aus? Drei Beispiel-Skills, je drei Anker auf der Stufe „klar beobachtet". Die Skills sind aus 200+ HIHB-Mandaten als wiederkehrende Critical-Few-Kandidaten bekannt. Die Anker stammen aus Horizon-Workshops mit Stakeholdern aus Industrie, Tech und Dienstleistung.

3.1 Skill: Daten-Storytelling

Die Erwartung dahinter: eine Person soll Daten so aufbereiten, dass die Entscheidung im Lenkungskreis besser wird. Nicht „kennt Tools", sondern „macht aus Zahlen eine Entscheidung". Drei Anker auf der Stufe „klar beobachtet":

Die drei Anker zeigen, was Daten-Storytelling im Arbeitsalltag ist: nicht Dashboard-Bau, sondern Entscheidungs-Ermoeglichung. Wer auf der Stufe „klar beobachtet" liegt, tut das oben. Wer auf der Stufe „ansatzweise" liegt, kann Dashboards bauen, aber reduziert nicht und benennt Datenqualitaet nicht. Wer auf der Stufe „vorbildhaft" liegt, tut die drei Anker plus einen vierten: zieht die Konsequenz aus der Empfehlung in den Folgemonaten nach und meldet zurueck, ob die Entscheidung im Lenkungskreis sich bewaehrt hat.

3.2 Skill: Stakeholder-Navigation

Die Erwartung dahinter: eine Person soll in einer Organisation mit konkurrierenden Interessen Mehrheiten bilden, ohne sich an eine Seite zu binden. Klassische Schluesselrolle im Mittelstand mit Familien-Vorstand, Beirat und operativer Geschaeftsleitung. Drei Anker auf der Stufe „klar beobachtet":

Diese drei Anker trennen die Person, die Stakeholder navigieren kann, von der Person, die Stakeholder vertroestet. Im Interview ist der Unterschied schwer zu erkennen, weil beide Typen die richtigen Begriffe verwenden. An den Ankern wird die Trennung sichtbar.

3.3 Skill: AI-Kollaboration

Die Erwartung dahinter: eine Person soll KI-Tools so einsetzen, dass die eigene Fachexpertise gestaerkt und nicht verdraengt wird. Nicht „kann ChatGPT bedienen", sondern „macht aus KI-Output professionelle Entscheidungsgrundlage". Drei Anker auf der Stufe „klar beobachtet":

Die drei Anker beantworten, was AI-Kollaboration im Schluesselrollen-Kontext ist: eine Fachperson, die KI als Werkzeug benutzt, ohne ihre Pruefpflicht abzugeben. Wer auf der Stufe „klar beobachtet" liegt, tut das. Wer auf der Stufe „ansatzweise" liegt, kennt die Tools, prueft aber nicht. Wer auf der Stufe „vorbildhaft" liegt, tut die drei Anker plus einen vierten: baut im Team Strukturen auf, in denen die Pruefung der KI-Outputs zur geteilten Routine wird, nicht zur Einzelleistung.

4Wie HIHB Horizon Anker produziert

Verhaltensanker fallen nicht vom Himmel und stehen nicht in einer Datenbank. Sie entstehen in einem Workshop, in dem die Stakeholder einer Schluesselbesetzung sich auf ihre Beobachtungs-Erwartung einigen. HIHB Horizon ist die Methode, mit der HireWorks diesen Workshop moderiert - aufbauend auf der 5C-Logik, die in der Pre-Recruiting-Methode verankert ist.

BARS-Matrix-Visualisierung: drei Critical-Few-Skills (Daten-Storytelling, Stakeholder-Navigation, AI-Kollaboration) auf der vertikalen Achse, vier Beobachtungs-Stufen (nicht beobachtet, ansatzweise, klar, vorbildhaft) auf der horizontalen Achse. Jede Zelle enthaelt einen kurzen, beobachtbaren Verhaltensanker als Text. Editorial-Tabellen-Optik im HIHB-Stil.
Fig. 01 - Die BARS-Matrix. Drei Skills, vier Stufen, zwoelf Anker. Aus jeder Zelle wird im Interview eine Beobachtung. Klick fuer Vergroesserung.

Pro Critical-Few-Skill produziert der Horizon-Workshop vier bis sechs Verhaltensanker. Die Mechanik laeuft in drei Schritten ab. Erstens: Situation eingrenzen. Die Stakeholder beschreiben zwei bis drei typische Arbeitssituationen, in denen sich der Skill zeigt. Ohne Situation entsteht kein Anker, sondern eine Vokabel-Liste. Zweitens: Verhalten ausformulieren. Pro Situation wird ein konkret beobachtbarer Satz formuliert, mit Subjekt, Handlung, Beobachtungs-Wahrnehmung. Drittens: Skala verankern. Die vier Stufen „nicht beobachtet", „ansatzweise", „klar", „vorbildhaft" werden durchgespielt, bis pro Stufe ein Anker steht.

Im Workshop ist die schwerste Stelle nicht die Formulierung, sondern die Verhandlung. Stakeholder haben oft unterschiedliche Beobachtungs-Erwartungen, ohne es zu wissen. Die HR-Direktorin meint mit „Stakeholder-Navigation" das ruhige Moderieren in Konflikten. Die Bereichsleitung meint die schnelle Mehrheitsbildung. Der Aufsichtsrat meint, dass die Position dem Gremium gegenueber Klarheit zeigt. Die drei Erwartungen sind nicht falsch, aber sie sind drei. Der Anker zwingt zur Entscheidung, welche Erwartung am Ende im Interview gepruft wird. Diese Entscheidung waere ohne den Workshop nie sichtbar geworden.

Horizon liefert pro Schluesselbesetzung am Ende ein Anker-Set fuer fuenf bis acht Critical-Few-Skills. Das Set wird im Interview-Bogen kodiert, der Skala-Bewertung im Bewertungs-Tool unterlegt und der Brueckenschlag in den 90-Tage-Plan gemacht. Die Methode ist in dieser Form ein direkter Anschluss an die Persona-Definition aus Edition II: Persona beschreibt, wer die Person ist, Verhaltensanker beschreibt, was diese Person konkret tut.

5Wie das im Interview funktioniert

Im Interview wirken Verhaltensanker, wenn die Frage nicht mehr das Skill-Label abfragt, sondern die Situation. Drei Beispiel-Fragen aus dem Horizon-Interview-Set:

Die Antworten der Kandidat:innen werden gegen die Anker gespiegelt. Ein Beispiel: Auf die zweite Frage antwortet ein Kandidat, er habe „beide Seiten zusammengebracht" und „die Win-Win-Loesung gefunden". Das passt zu keinem der drei Anker auf der Stufe „klar beobachtet" - die Anker sprechen von Einzelgespraechen, von Vorab-Skizzen, von Interessen sichtbar machen statt glaetten. Der Kandidat steht also auf der Stufe „ansatzweise". Das ist keine Abwertung, sondern eine Klarheit. Wer auf der Stufe „ansatzweise" liegt und in einer Rolle landet, die „klar beobachtet" braucht, hat im 90-Tage-Plan ein konkretes Entwicklungs-Ziel statt einer vagen Erwartung.

Was im Interview nicht bewertet werden sollte: die rhetorische Qualitaet der Antwort. Eine Kandidat:in, die schoen erzaehlt, ist nicht automatisch besser. Die Anker fragen nach Handlungen, nicht nach Erzaehlungen. Eine sehr knappe, prosaisch unbeholfene Antwort, die genau die drei Anker bedient, ist im Ergebnis besser als eine eloquent ausschweifende, die keinen davon trifft. Diese Trennung ist im deutschen Mittelstand wichtig, weil das Vorstellungsgespraech kulturell die Geschichten-Person bevorzugt - und die Geschichten-Person nicht immer die Verhaltens-Person ist. Dieser Punkt verbindet sich direkt mit den Cultural-Fit-Verzerrungen, die wir an anderer Stelle ausfuehrlicher behandelt haben.

Wichtig auch: Anker werden nicht im Interview vorgelesen. Die Bewertenden kennen sie, die Kandidat:innen nicht. Wer die Anker offenlegt, bekommt Antworten, die die Anker bedienen, ohne dass die Verhaltens-Realitaet dahinter steht. Die Methode setzt voraus, dass die Bewertenden trainiert sind - das ist die zweite Voraussetzung neben der Anker-Formulierung selbst.

6Anti-Patterns: wie man Anker NICHT formuliert

Vier wiederkehrende Fehler tauchen in Workshops auf, in denen Stakeholder zum ersten Mal mit Verhaltensankern arbeiten. Sie sind alle gut gemeint und sie zerstoeren alle die Methode.

Fehler 1: Eigenschaftszuschreibung statt Verhalten. Ein typischer erster Versuch lautet „Ist proaktiv". Das ist kein Anker. Es ist eine Eigenschaftszuschreibung, die jeder Kandidat:innen-Beobachterin im Spielraum laesst, ob „proaktiv" gerade vorlag oder nicht. Der korrigierte Anker lautet etwa: „Meldet sich in der wochentlichen Team-Synchronisation mit eigenen Vorschlaegen, bevor die Moderation explizit danach fragt. Hat den Vorschlag schriftlich vorbereitet."

Fehler 2: Skill-Label im Anker wiederholen. Wer schreibt „Zeigt klare Daten-Storytelling-Faehigkeit", hat den Anker nicht formuliert, sondern dem Label ein Adjektiv vorangesetzt. Der Anker muss die Vokabel des Skills nicht enthalten. Wenn das Verhalten konkret genug ist, weiss jede Lesende, welcher Skill gemeint war.

Fehler 3: Beobachtungs-Wahrnehmung weglassen. Ein Anker wie „Versteht Kunden-Bedarf" haengt in der Luft, weil niemand „Verstehen" beobachten kann. Der korrigierte Anker macht das Verstehen sichtbar: „Wiederholt im Folgesatz den Kunden-Bedarf in eigenen Worten. Korrigiert dabei eine eigene Annahme, falls sie der Kundin nicht entspricht."

Fehler 4: Stufen nicht trennscharf. Wer auf der Skala „nicht beobachtet", „ansatzweise", „klar", „vorbildhaft" zwischen den Anker-Saetzen nur graduelle Adverbien aendert („Tut es teilweise", „Tut es", „Tut es sehr gut"), hat keine Anker, sondern eine getarnte numerische Skala. Trennscharfe Stufen brauchen unterschiedliche Verhaltensbeschreibungen - nicht denselben Satz mit anderer Intensitaet.

Wenn diese vier Fehler im Workshop sichtbar werden, ist das ein gutes Zeichen: die Stakeholder lernen die Methode. Die Korrektur dauert pro Anker zwischen zwei und fuenf Minuten. Sie ist das eigentliche Arbeitsergebnis des Workshops. Die Anker, die am Ende auf der Wand stehen, sind nicht mehr verhandelbar - sie sind die geteilte Beobachtungs-Sprache, mit der das Interview, der 90-Tage-Plan und das spaetere Performance-Gespraech gegen dasselbe Verhalten gepruet werden.

7Schluss: vom Schlagwort zur Pruefung

Wer in den Lebenslauf eines Kandidaten schaut und dort „Change Management" liest, hat keine Information. Er hat ein Versprechen. Ohne Verhaltensanker bleibt es ein Versprechen, das im Interview bestaetigt oder dementiert wird, je nachdem, wer wie freundlich nickt. Mit Verhaltensankern wird daraus eine Pruefung: an konkretem Verhalten, in konkreter Situation, gegen geteilte Erwartung. Die methodische Schwere der Skill-Frage liegt nicht im Skill-Label, sondern in der Anker-Formulierung. Wer die Anker hat, hat die Pruefung. Wer sie nicht hat, hat das Bauchgefuehl.

Die Methode ist kein HIHB-Eigenbau. Sie ist eine 50-jaehrige Tradition aus der industriellen Psychologie, aus McClellands 1973er-Aufsatz, aus Boyatzis' 1982er-Studie, aus SHLs Universal Competency Framework und aus der psychometrischen Validierungs-Literatur. HIHB Horizon uebertraegt sie auf die Schluesselbesetzungen im Mittelstand und integriert sie in den Pre-Recruiting-Workshop, in dem Critical-Few-Skills bestimmt und in beobachtbares Verhalten uebersetzt werden. Das ist der Sprung, der „Skills of the Future" vom Buzzword in die Praxis fuehrt: nicht im Katalog, sondern im Anker.

Haeufig gestellte Fragen

Was ist ein Verhaltensanker im Recruiting-Kontext?

Ein Verhaltensanker ist die Beschreibung eines beobachtbaren Verhaltens in einer konkreten Situation, die einen abstrakten Skill messbar macht. Statt „Change Management" als Skill-Label zu nennen, beschreibt der Verhaltensanker, was eine Person in einem Konflikt zwischen zwei Bereichen konkret sagt oder tut. Die Methode stammt aus den Behavioural Anchored Rating Scales (BARS) und ist eine etablierte Technik fuer Interview, Performance-Review und Curriculum-Design.

Was ist die BARS-Methode?

BARS steht fuer Behavioural Anchored Rating Scales und ist ein Bewertungsverfahren, das eine Skala mit konkreten Verhaltensbeispielen verankert. Statt „sehr gut bis schlecht" zu fragen, beschreibt jede Stufe ein konkretes Verhalten in einer typischen Arbeitssituation. Die Methode wurde in den 1960er und 1970er Jahren in der industriellen Psychologie entwickelt und gilt in der Forschung als reliabler als rein numerische Skalen. SHL hat sie im Universal Competency Framework systematisch fuer Recruiting verfuegbar gemacht.

Wie viele Verhaltensanker braucht ein Future-Skill?

HIHB Horizon produziert pro Critical-Few-Skill vier bis sechs Verhaltensanker. Vier ist die Untergrenze, weil die Skala mindestens „nicht beobachtet", „ansatzweise", „klar" und „vorbildhaft" abbilden muss. Sechs ist die Obergrenze, weil mehr Anker das Interview ueberlasten und die Bewertenden den Ueberblick verlieren. Die Anker werden im Workshop mit den Stakeholdern formuliert, nicht aus einer Datenbank gezogen.

Was ist der Unterschied zwischen einem Skill-Label und einem Verhaltensanker?

Ein Skill-Label ist ein abstraktes Wort wie „AI-Kollaboration" oder „Stakeholder-Navigation". Es benennt eine Faehigkeit, beschreibt sie aber nicht. Ein Verhaltensanker ist die konkrete, beobachtbare Auspraegung in einer Situation: „Konfrontiert ein KI-Output gegen das eigene Fachwissen und benennt den Konflikt offen." Skill-Labels lassen sich nicht im Interview pruefen. Verhaltensanker schon.

Quellen

  1. McClelland, David C., „Testing for Competence Rather Than for ‚Intelligence'", American Psychologist, Vol. 28(1), 1973, S. 1-14. Begruendungs-Aufsatz der Competency-Bewegung; Argument, dass beobachtetes Verhalten ein besserer Praediktor fuer Berufserfolg ist als Intelligenztests. Verfuegbar in der APA PsycNet-Datenbank: psycnet.apa.org/record/1973-22126-001.
  2. Boyatzis, Richard E., The Competent Manager: A Model for Effective Performance, John Wiley & Sons, New York, 1982. Untersuchung von etwa 2.000 Managerinnen und Managern in 41 verschiedenen Rollen in 12 Organisationen; identifiziert 19 Kompetenzen in vier Clustern mit beobachtbaren Verhaltensbeschreibungen. Verfuegbar im Internet Archive: archive.org/details/competentmanager0000boya.
  3. Zur psychometrischen Validitaet von BARS siehe stellvertretend: Lopez Garcia et al., „Assessing Teaching Effectiveness in Blended Learning Methodologies: Validity and Reliability of an Instrument with Behavioral Anchored Rating Scales", Frontiers in Psychology, 2022 (Cronbachs Alpha 0,956, RMSEA 0,042, Varianz-Aufklaerung 77,6%): ncbi.nlm.nih.gov/pmc/articles/PMC9598132. Sowie die fruehe Reliabilitaets-Studie von Stoskopf et al., „The Reliability and Construct Validity of a Behaviorally Anchored Rating Scale Used To Measure Nursing Assistant Performance", Evaluation Review 16(3), 1992.
  4. Bartram, Dave, „The SHL Universal Competency Framework", SHL White Paper, 2012. Beschreibt die „Great 8" Kompetenz-Faktoren mit 20 Dimensionen und die zugehoerigen Verhaltensanker, Interview-Fragen und Assessment-Aufgaben. Verfuegbar als PDF: shl.com/assets/campaigns/global/competency-fit/universal-competency-framework-whitepaper-en.pdf.
Michael von Hirschfeld
Geschaeftsfuehrer HireWorks GmbH - 200+ HIHB-Workshops

Verantwortet die HIHB-Methodik bei HireWorks. Moderiert seit 2018 Workshops mit Geschaeftsfuehrungen und Hiring-Manager:innen in DACH-Mittelstand und Konzernen. HIHB Horizon ist die Methode fuer die strategische Skill-Architektur in der Pre-Recruiting-Phase.

Eine Schluesselbesetzung mit Future-Skills:
Horizon-Workshop kennenlernen.

Im Horizon-Workshop bestimmen wir Ihre fuenf bis acht Critical-Few-Skills und formulieren pro Skill vier bis sechs Verhaltensanker. Im 30-Minuten-Sondierungs-Gespraech klaeren wir, ob die Methode zu Ihrer Schluesselbesetzung passt.

Horizon-Workshop kennenlernen

Weiter zur verwandten Methodik: Persona statt Anforderungsliste beschreibt, wie aus dem Skill-Profil eine konkrete Person wird - die methodische Schwester der Verhaltensanker.