Barrierefreiheit im digitalen Raum ist kein Nischenthema mehr. Die EU-Richtlinie zur Barrierefreiheit von Websites öffentlicher Einrichtungen und zunehmend auch privatwirtschaftlicher Angebote setzt klare Standards. Und selbst wenn Sie keine rechtliche Verpflichtung haben: Videos ohne Untertitel schliessen nicht nur Menschen mit Hörbehinderungen aus, sondern auch alle, die Videos ohne Ton schauen - und das sind deutlich mehr als Sie vielleicht denken.
Warum Barrierefreiheit bei Videos wichtig ist
Drei Argumente, die über den ethischen Aspekt hinausgehen:
Rechtliche Anforderungen
In Deutschland sind öffentliche Stellen (Behörden, Universitäten, öffentlich-rechtliche Institutionen) seit 2019 verpflichtet, ihre digitalen Inhalte barrierefrei zu gestalten - basierend auf der BITV 2.0, die auf WCAG 2.1 Level AA aufbaut. Für private Unternehmen gelten aktuell noch keine durchgehenden rechtlichen Verpflichtungen, aber das Barrierefreiheitsstärkungsgesetz (BFSG), das ab 2025 gilt, erweitert die Anforderungen schrittweise auf den privaten Sektor.
Strategischer Vorteil
In Deutschland leben ca. 80.000 gehörlose und 240.000 schwerhörige Menschen. Weltweit sind es über 430 Millionen Menschen mit relevantem Hörverlust (WHO, 2023). Das ist eine Zielgruppe, die Sie mit barrierefrei zugänglichen Videos erreichen - und ohne Untertitel komplett ausschliessen.
SEO-Vorteil
Google kann Videos nicht "sehen" oder "hören" - aber es kann Text lesen. Transkripte und Captions sind Text, den Suchmaschinen indexieren. Ein Video mit vollständigem Transkript rankt für deutlich mehr Keywords als dasselbe Video ohne. Mehr dazu im Abschnitt SEO-Vorteil weiter unten.
WCAG 2.1 Anforderungen für Videos
Die Web Content Accessibility Guidelines (WCAG) 2.1 definieren drei Konformitätsstufen: A (minimal), AA (Standard) und AAA (maximal). Für Videos gelten folgende Anforderungen:
| Video-Typ | Level A | Level AA | Level AAA |
|---|---|---|---|
| Voraufgezeichnet (Audio + Video) | Captions, Audiodeskription oder Textalternative | Captions, Audiodeskription | Erweiterte Audiodeskription, Gebärdensprache |
| Nur Audio (Podcast etc.) | Texttranskript | Texttranskript | Erweiterte Beschreibung |
| Live-Video | Echtzeit-Captions | Echtzeit-Captions | Echtzeit-Captions + Audiodeskription |
| Nur Video (ohne Audio) | Texttranskript oder Audiodeskription | Texttranskript oder Audiodeskription | Audiodeskription |
Für die meisten Unternehmensvideos - voraufgezeichnet, mit Voiceover und Bild - ist Level AA der relevante Standard. Das bedeutet: Captions und Audiodeskription (oder eine vollwertige Textalternative).
Untertitel vs. Closed Captions vs. Transkripte: Unterschiede
Untertitel (Subtitles)
Untertitel übersetzen gesprochenen Text in eine andere Sprache. Wer ein englisches Video auf einer deutschen Website einbettet und deutsche Untertitel hinzufügt, nutzt Untertitel. Sie sind für Muttersprachler gedacht, die die Originalsprache nicht verstehen.
Closed Captions (CC)
Closed Captions sind eine vollständige Textdarstellung aller hörbaren Inhalte - gesprochener Text, aber auch Hintergrundgeräusche, Musik-Bezeichnungen und nicht-verbale Lautäusserungen wie [Applaus] oder [Türklingeln]. Sie richten sich primär an hörbehinderte Zuschauer. Das Wort "Closed" bedeutet, dass sie ein- und ausgeschaltet werden können (im Gegensatz zu "Open Captions", die fest ins Bild gebrannt sind).
Transkript
Ein Transkript ist eine vollständige Textfassung des Video-Inhalts, als separates Dokument - nicht im Video integriert. Es ist die zugänglichste Form für Menschen, die das Video nicht abspielen können oder möchten. Und es ist aus SEO-Sicht besonders wertvoll, weil Google es vollständig indexiert.
Empfehlung: Für maximale Zugänglichkeit und SEO-Wirkung bieten Sie alle drei an: Closed Captions im Video, Untertitel in relevanten Sprachen und ein verlinktes Transkript unterhalb des Videos.
Audio-Deskription: Was es ist und wann es nötig ist
Audio-Deskription (auch "Audiodeskription" oder "AD") beschreibt visuelle Inhalte eines Videos, die für blinde und sehbehinderte Menschen nicht zugänglich sind. Eine Stimme beschreibt während der Pausen im Ton, was auf dem Bildschirm zu sehen ist: "Eine Person betritt das Büro und öffnet einen Laptop."
Wann ist Audio-Deskription notwendig?
Audio-Deskription ist dann nötig, wenn relevante visuelle Informationen im Video nicht über den Ton vermittelt werden. Bei einem Erklärvideo mit Voiceover, der alles erklärt was zu sehen ist, ist oft keine separate AD nötig - der Voiceover funktioniert als eingebaute Beschreibung. Bei Videos, in denen Texte, Grafiken oder visuelle Szenen ohne verbale Begleitung wesentliche Informationen tragen, ist AD erforderlich.
Praktische Umsetzung
Audio-Deskription wird meist in einer separaten Tonspur hinterlegt. Nutzer können wählen, ob sie die Standardton-Spur oder die AD-Spur abspielen möchten. Alternativ kann eine "Extended Audio Description" mit eingebauten Pausen produziert werden, in denen die Beschreibung Platz hat.
Automatische vs. manuelle Untertitel
Automatische Untertitel
YouTube, Vimeo und viele andere Plattformen bieten automatische Transkription über KI-basierte Speech-to-Text-Technologie. YouTube Auto-Captions sind für häufige Sprachen wie Deutsch inzwischen recht gut - aber nicht gut genug für rechtliche oder WCAG-Konformität.
Typische Fehlerquellen bei Auto-Captions:
- Eigennamen und Markenbezeichnungen werden falsch transkribiert
- Fachbegriffe aus Nischenbranchen werden missverstanden
- Dialekte, Akzente und schnelles Sprechtempo erhöhen die Fehlerquote
- Satzzeichen und Grossschreibung werden oft falsch gesetzt
Manuelle Untertitel
Manuell erstellte Captions sind präzise, rechtssicher und für WCAG-Konformität erforderlich. Sie können selbst erstellt werden (zeitaufwendig) oder von Dienstleistern wie Rev.com, Untertitel.de oder spezialisierten Caption-Agenturen produziert werden. Kosten: ca. 1-3 EUR pro Minute Video.
Workflow-Empfehlung: Laden Sie das Auto-Caption-Transkript von YouTube oder Vimeo herunter, korrigieren Sie es in einem Texteditor und laden Sie die korrigierte .SRT-Datei wieder hoch. Das spart 70-80% der Zeit gegenüber manuellem Tippen, bei voller Qualitätskontrolle.
Silent-Autoplay: 85% schauen ohne Ton
Eine Zahl, die viele Marketers überrascht: 85% aller Video-Views auf Facebook, Instagram und LinkedIn passieren ohne Ton. Auf Websites mit Autoplay ist der Anteil ähnlich hoch, weil Browser-Richtlinien (Chrome, Safari, Firefox) Autoplay-Sound standardmässig blockieren.
Was das bedeutet
Ihr Video muss auch ohne Ton vollständig verständlich sein. Das ist keine nette Zusatzfunktion, sondern eine Grundvoraussetzung für Wirksamkeit im digitalen Umfeld. Und es deckt sich perfekt mit den Anforderungen der Barrierefreiheit: Ein Video, das auch für Gehörlose funktioniert, funktioniert auch für alle anderen ohne Ton.
Design-Implikationen
- Wichtige Botschaften auch als eingeblendeter Text sichtbar machen
- Open Captions (fest ins Bild gebrannte Untertitel) für Social-Media-Versionen
- Visuelle Handlungsführung: Was passiert im Bild, muss auch ohne Ton verständlich sein
- CTAs als eingeblendete Texte, nicht nur als gesprochene Ansage
Technische Umsetzung: SRT, WebVTT und Plattformen
Dateiformat: SRT vs. WebVTT
Die zwei wichtigsten Caption-Dateiformate sind:
- SRT (SubRip Text): Das universelle Standardformat. Jede Plattform (YouTube, Vimeo, social Media) unterstützt SRT. Einfache Textstruktur: Nummer, Zeitstempel, Text.
- WebVTT (Web Video Text Tracks): Der modernere Standard für HTML5-Videos. Erlaubt Formatierungen (fett, kursiv), Positionierung und CSS-Styling. Für eigene Website-Player bevorzugt.
Plattform-spezifische Hinweise
- YouTube: Unterstützt SRT, VTT, SBV. Upload über Studio unter "Untertitel". Auto-Captions können exportiert, bearbeitet und wieder hochgeladen werden.
- Vimeo: Unterstützt SRT und WebVTT. Upload über Video-Einstellungen unter "Textspuren".
- LinkedIn: Unterstützt SRT für nativ hochgeladene Videos. Kein Support für YouTube-eingebettete Videos.
- HTML5-Video-Tag: Captions werden über das <track>-Element eingebunden:
<track kind="captions" src="untertitel.vtt" srclang="de">
SEO-Vorteil von Untertiteln und Transkripten
Der SEO-Effekt von Video-Captions ist gut dokumentiert und wird von vielen Unternehmen unterschätzt:
Indexierung durch Google
Google kann den Text von Captions und Transkripten lesen und indexieren. Das bedeutet: Ihr Video wird für Keywords gefunden, die ausschliesslich im gesprochenen Kommentar vorkommen. Ohne Captions sind diese Keywords für Suchmaschinen unsichtbar. Mehr zum Thema Video SEO und YouTube-Ranking.
Längere Verweildauer
Videos mit Untertiteln werden im Durchschnitt bis zu 40% häufiger komplett angeschaut. Das verbessert die Watchtime - ein wichtiger Ranking-Faktor auf YouTube und ein positives Signal für Google bezüglich der Seitenqualität.
Transkript auf der Website
Ein vollständiges Transkript unterhalb eines eingebetteten Videos liefert Google hunderte zusätzliche Wörter indexierbaren Text - auf der Seite, auf der das Video liegt. Das verbessert die Keyword-Abdeckung der Seite erheblich ohne künstlich aufgeblähten Textinhalt.
Wie 3DStory mit Barrierefreiheit umgeht
Bei 3DStory produzieren wir standardmässig Videos mit Voiceover, der alle wesentlichen visuellen Inhalte auch sprachlich vermittelt. Das ist bei gut geschriebenen Erklärvideo-Skripten oft von Natur aus der Fall.
Auf ausdrücklichen Kundenwunsch liefern wir zusätzlich:
- SRT-Datei mit zeitcodierten Untertiteln auf Basis des Voiceover-Textes
- Open-Caption-Version für Social Media (Untertitel fest ins Bild gebrannt)
- Vollständiges Transkript als Textdokument
- Silent-Version ohne Ton für Messe-Displays und Autoplay-Anwendungen
Wenn Sie ein Erklärvideo, Werbevideo oder Produktvideo bei uns in Auftrag geben, sprechen Sie uns auf Ihre spezifischen Barrierefreiheits-Anforderungen an - wir berücksichtigen diese in der Produktion.
Häufige Fragen zur Video-Barrierefreiheit
Laut WCAG 2.1 Level AA müssen voraufgezeichnete Videos mit Audio Untertitel (Captions) enthalten. Voraufgezeichnete Videos mit relevanten visuellen Inhalten benötigen Audio-Deskription oder eine Textalternative. Live-Videos müssen Echtzeit-Captions haben. Reine Audio-Inhalte benötigen ein Texttranskript.
Untertitel übersetzen gesprochenen Text in eine andere Sprache. Closed Captions (CC) transkribieren alles - also auch Umgebungsgeräusche, Musik und nicht-verbale Lautäusserungen - für hörbehinderte Zuschauer. Im deutschen Sprachraum werden beide Begriffe oft synonym verwendet, gemeint sind meist Closed Captions.
Ja. Google und YouTube indexieren den Text von Transkripten und Captions. Ein Video mit korrekt hinterlegten Untertiteln wird für mehr Keywords gefunden als ein Video ohne. Zusätzlich verbessert sich die Watchtime, weil Zuschauer das Video auch ohne Ton bis zum Ende schauen können.
Nein. YouTube-Auto-Captions haben eine Fehlerquote von ca. 5-10%, bei Fachbegriffen und Eigennamen höher. Für WCAG-Konformität und rechtliche Anforderungen sind manuell erstellte oder nachkorrigierte Captions erforderlich. Automatische Captions sind ein guter Ausgangspunkt, aber kein Ersatz für geprüfte Qualität.
Barrierefreies Video produzieren lassen?
Wir berücksichtigen Ihre Barrierefreiheits-Anforderungen von Anfang an in der Produktion - ohne Aufpreis für die Grundanforderungen.
Kostenloses Erstgespräch