Was ist Alt-Text-Generierung?
Alt-Text (Alternativtext) ist eine textliche Beschreibung eines Bildes, die von Screenreadern vorgelesen wird. Menschen mit Sehbehinderungen sind auf diese Beschreibungen angewiesen, um den Inhalt von Bildern zu verstehen. Guter Alt-Text ist also kein Nice-to-have, sondern eine Grundvoraussetzung für barrierefreie Websites.
Formidex nutzt das ViT-GPT2-Modell, das Bilder analysiert und automatisch eine passende Beschreibung generiert. Das Modell kombiniert einen Vision Transformer (ViT) für die Bilderkennung mit GPT-2 für die Texterzeugung. So entstehen natürlich klingende Beschreibungen.
Die WCAG-Richtlinien (Web Content Accessibility Guidelines) verlangen, dass alle informativen Bilder einen Alternativtext haben. Suchmaschinen nutzen Alt-Texte außerdem, um Bilder zu indexieren. Guter Alt-Text verbessert also gleichzeitig die Barrierefreiheit und die SEO.
Wie funktioniert die Alt-Text-Generierung?
Der Vision Transformer zerlegt das Bild in kleine Patches und analysiert deren Zusammenhänge. Er erkennt Objekte, Szenen und Aktionen. Diese visuelle Information wird dann an das GPT-2-Sprachmodell übergeben, das daraus eine zusammenhängende Beschreibung formuliert.
Das Modell generiert englische Beschreibungen, die du als Ausgangspunkt verwenden und bei Bedarf anpassen kannst. Für deutschsprachige Websites empfiehlt es sich, den generierten Text zu übersetzen und an den Kontext der Seite anzupassen.
Tipps für beste Ergebnisse
Verwende den generierten Alt-Text als Startpunkt und passe ihn an. Die KI beschreibt, was sie sieht, kennt aber nicht den Kontext deiner Website. Ergänze wichtige Details, die für das Verständnis im jeweiligen Zusammenhang relevant sind.
Halte Alt-Texte prägnant. Screenreader lesen den gesamten Text vor, deshalb sollte eine Beschreibung idealerweise nicht länger als ein bis zwei Sätze sein. Vermeide Formulierungen wie "Bild von" oder "Foto von", da der Screenreader bereits ankündigt, dass es sich um ein Bild handelt.
Dekorative Bilder, die keinen inhaltlichen Mehrwert bieten, sollten ein leeres alt-Attribut bekommen (alt=""). So überspringt der Screenreader diese Bilder und stört den Lesefluss nicht.
Häufige Anwendungsfälle
Barrierefreiheit von Websites verbessern: Viele Websites haben hunderte Bilder ohne Alt-Text. Mit der automatischen Generierung kannst du schnell Beschreibungen für alle Bilder erstellen und nachträglich für Barrierefreiheit sorgen.
SEO-Optimierung: Suchmaschinen können Bilder nicht sehen, sie sind auf den Alt-Text angewiesen. Gut beschriebene Bilder erscheinen häufiger in der Bildersuche und können zusätzlichen Traffic auf deine Website bringen.
Content-Management im Team: Wenn viele Personen Inhalte pflegen, wird der Alt-Text oft vergessen. Die automatische Generierung kann als Qualitätssicherung dienen und sicherstellen, dass kein Bild ohne Beschreibung veröffentlicht wird.