- Home
- KI Handling Time
KI Handling Time: Was die neue Kennzahl im KI-Kundenservice wirklich misst
KI Handling Time beschreibt die durch künstliche Intelligenz beeinflusste Bearbeitungszeit einer Kundenservice-Interaktion. Anders als die klassische Average Handle Time misst sie nicht nur, wie lange ein Kontakt dauert, sondern wie sich diese Dauer verändert, wenn ein Chatbot, ein Voicebot oder ein KI-Telefonassistent beteiligt ist. Der Begriff ist jung. Er taucht in der Fachliteratur erst seit kurzem auf und ist noch kein etablierter Standard wie AHT, FCR oder CSAT. Genau das macht ihn interessant, denn er zwingt zu einer Frage, die viele Unternehmen beim KI-Einsatz übersehen: Bewertet man eine KI-Interaktion wirklich nach denselben Regeln wie das Gespräch eines menschlichen Agenten?
Die kurze Antwort lautet nein. Und der Rest dieses Artikels erklärt, warum.
Auf einen Blick
KI Handling Time (KHT) ist die durch KI beeinflusste Bearbeitungszeit einer Kundenservice-Interaktion. Sie misst nicht nur Dauer, sondern bewertet diese Dauer im Kontext von Lösungsqualität, Übergabe- und Wiederkontaktquote. Eine lange KHT ist nur dann negativ, wenn sie ohne Ergebnis bleibt.
KI Handling Time vs. Average Handle Time: der entscheidende Unterschied
Die Average Handle Time, kurz AHT, ist eine der ältesten Kennzahlen im Call Center. Sie setzt sich aus drei Teilen zusammen: der Gesprächszeit, der Haltezeit und der Nachbearbeitungszeit, geteilt durch die Anzahl der Kontakte. Die Formel lautet:
AHT = (Gesprächszeit + Haltezeit + Nachbearbeitungszeit) / Anzahl der Interaktionen
Bei menschlichen Agenten ist eine hohe AHT fast immer ein Problem. Jede zusätzliche Minute kostet Personalzeit, bindet Kapazität und erhöht die Wartezeit für den nächsten Anrufer. Deshalb steht die AHT in vielen Teams unter ständigem Senkungsdruck.
Bei KI-Kanälen kippt diese Logik. Eine zusätzliche Minute, die ein KI-Telefonassistent mit einem Anrufer verbringt, kostet kaum etwas und blockiert keine menschliche Kapazität. Die KI führt parallel beliebig viele Gespräche. Damit verliert die reine Dauer ihre Aussagekraft. Eine lange KI Handling Time kann ein Zeichen für ein Problem sein, sie kann aber genauso gut bedeuten, dass die KI in einem einzigen Kontakt mehrere Anliegen erledigt hat.
Ist eine lange KI Handling Time schlecht?
Nicht die Länge entscheidet, sondern das Ergebnis. Eine lange KI Handling Time ist positiv, wenn der Kunde in einem Kontakt mehrere Themen löst, etwa Lieferstatus, Adressänderung und eine Retourenfrage. Im menschlichen Call Center würde so ein Gespräch die AHT belasten. Im KI-Kanal ist es ein Gewinn, weil es drei einzelne Kontakte und womöglich eine menschliche Bearbeitung ersetzt.
Negativ wird eine lange KI Handling Time, wenn die KI den Nutzer nicht zum Ziel führt. Das stärkste Warnsignal ist eine lange Interaktion, an deren Ende doch ein Mensch übernehmen muss, der den Fall dann von vorne aufrollt. Solche Verläufe deuten fast immer auf dieselben Ursachen hin: zu generische Prompts, schwache Skill-Regeln, schlechte Intent-Erkennung oder eine KI, die zwar antwortet, aber keine echte Aktion ausführen kann.
Die Prüfregel ist einfach. Eine lange KI Handling Time ist gut, wenn sie mit hoher Lösungsquote, niedriger Übergabequote, niedriger Wiederkontaktquote und zufriedenen Kunden einhergeht. Sie ist schlecht, wenn Abbrüche, Wiederholungen, späte Übergaben oder erneute Kontakte innerhalb von 24 bis 72 Stunden dazukommen.
Das KPI-Set für KI Handling Time
KI Handling Time sollte nie allein betrachtet werden. Sinnvoll ist ein Set, das Zeit, Ergebnis und Kundenerlebnis zusammen misst. Die wichtigsten Kennzahlen:
-
KI Lösungsrate (KLR)
Anteil der Fälle, die die KI vollständig ohne Menschen löst. Der eigentliche Nutzennachweis.
-
Human-Übergabequote (HÜQ)
Anteil der KI-Interaktionen, die an einen Menschen gehen. Ein starker Diagnosewert, aber nur dann negativ, wenn die Übergabe spät, ungeplant und ohne Kontext erfolgt.
-
Containment Rate
Anteil der Dialoge, die ohne menschliche Übergabe enden. Nützlich, aber gefährlich, wenn man sie isoliert betrachtet.
-
True Containment Quality (TCQ)
Die qualitätsbereinigte Version der Containment Rate. Sie zählt nur Fälle, die wirklich gelöst wurden.
-
Wiederkontaktquote in 72 Stunden (WKR-72)
Entlarvt falsche Containment-Erfolge. Wer abbricht und am nächsten Tag erneut anruft, wurde nicht gelöst.
-
Multi-Intent-Lösungsrate (MI-LR)
Anteil der Kontakte, in denen die KI mehrere Anliegen erledigt. Erklärt lange, aber wertvolle Interaktionen.
-
Fallback Rate
Anteil der nicht verstandenen Anfragen. Diagnose für Prompting und Wissenslücken.
-
CSAT und CES
Zufriedenheit und Aufwand aus Kundensicht, als Schutz gegen oberflächliche Beschleunigung.
Wie diese Kennzahlen in einen belastbaren Business Case einfließen, zeigt der ROI-Leitfaden für KI im Kundenservice. Welche Systeme die KPIs überhaupt liefern können, vergleicht der Überblick zu KI-Tools im Kundenservice.
Containment Rate ist nicht gleich gelöst
Eine hohe Containment Rate sieht in jedem Reporting gut aus. 80 oder 90 Prozent klingen nach Erfolg. Der Wert sagt aber nur, dass kein Mensch übernommen hat. Er sagt nichts darüber, ob der Kunde zufrieden war oder ob er entnervt aufgelegt hat und am nächsten Tag erneut anruft.
Deshalb lohnt die Unterscheidung zwischen technischem und echtem Containment. True Containment liegt erst vor, wenn die KI ohne Menschen gelöst hat, der Kunde nicht innerhalb von 24 bis 72 Stunden mit demselben Anliegen zurückkommt, keine schlechte Bewertung hinterlässt und keine spätere Eskalation nötig wird. Die verwandte Deflection Rate misst, wie viele menschliche Tickets wirklich vermieden wurden, nicht weil der Kunde ferngehalten wurde, sondern weil kein Mensch nötig war.
Was die Studienlage zeigt
Die viel zitierte NBER-Studie „Generative AI at Work" untersuchte über 5.000 Kundenservice-Agenten mit einem generativen KI-Assistenten. Wichtig ist die saubere Trennung der Zahlen: Die oft genannten rund 14 Prozent beziehen sich auf die Produktivität, also gelöste Fälle pro Stunde. Die reine Zeitersparnis pro Chat lag bei etwa 9 Prozent. Wer 14 Prozent als direkte Verkürzung der Bearbeitungszeit darstellt, zitiert die Studie falsch.
Gartner erwartet, dass agentische KI bis 2029 rund 80 Prozent der häufigen Kundenservice-Anliegen autonom löst und die operativen Kosten um etwa 30 Prozent senkt. Klarna meldete für seinen KI-Assistenten eine Senkung der Lösungszeit von 11 auf unter 2 Minuten bei vergleichbarer Zufriedenheit. Die spätere Einordnung des Klarna-CEO zeigt allerdings, dass daraus kein reines Ersetzen von Menschen wurde, sondern ein Hybridmodell: KI für einfache und mittlere Fälle, Menschen für komplexe und emotionale Gespräche. Genau dieses Hybridbild ist die realistische Lesart, nicht das Bild der vollständigen Automatisierung.
Weiterführende Quellen
- florschuetz-consulting.de – Quality-Adjusted AHT als Management-Sicht auf KI-Kennzahlen.
- assistent24.de – KI-Telefonassistent messen: Praxis und Telefonie-Kennzahlen.
- Innerhalb von kundenservice.ai: KI Readiness Check · ROI-Leitfaden · KI-Tools im Kundenservice.