Dieser Prototyp demonstriert, wie semantische Richtlinien des WCAG mithilfe künstlicher Intelligenz kontextbezogen und automatisiert umgesetzt werden können. Anhand der Generierung von Alt-Texten für Bilder (WCAG Erfolgskriterium 1.1.1.) wird gezeigt, wie Kontext aus dem HTML-Inhalt einer Webseite extrahiert, Bilder analysiert und passende Bildbeschreibungen erstellt werden.
Er kann sehr gerne mit eigenen Daten ausprobiert werden, aber wir haben auch einige Beispielszenarien vorbereitet. Diese können einfach per Dropdown ausgewählt werden.
Nach der Auswahl eines Szenarios sehen Sie im Folgenden den Screenshot einer Webseite, die potenziell keine Alt-Texte für ihre Bilder enthält. Das ist ein häufiges Problem, das die Zugänglichkeit von Webinhalten einschränkt.
Wir nutzen fortschrittliche KI-Modelle, um den Kontext einer Webseite zu erfassen und in diesem Beispiel Bildbeschreibungen zu generieren. Alles ist modular aufgebaut, sodass verschiedene KI-Modelle je nach Funktion, Situation und Marktlage verwendet werden können.
In diesem Schritt versuchen wir, den Kontext des Bildes aus dem umgebenden Textinhalt zu verstehen. Der Kontext gibt uns wichtige Hinweise darauf, wie das Bild interpretiert werden sollte.
Hier geben Sie die Textinhalte ein, die in der Umgebung des Bildes auf der Webseite platziert sind. Dies hilft uns, den Kontext des Bildes besser zu verstehen. Zu Testzwecken haben wir für unseren Prototypen auf den Einsatz von Crawlern verzichtet, dieser ist für das Endprodukt jedoch vorgesehen.
Basierend auf dem bereitgestellten Textinhalt, welche Fragen könnten relevant sein, um den Kontext des Bildes zu verstehen?
Wählen Sie ein KI-Modell aus, das den Kontext analysieren soll. Unterschiedliche Modelle können unterschiedliche Perspektiven bieten.
In diesem Schritt verwenden wir die Azure API, um Informationen und Daten aus dem bereitgestellten Bild zu extrahieren. Dies gibt uns Einblick in die Struktur und den Inhalt des Bildes.
In diesem Abschnitt können Sie eine URL zu einem Bild Ihrer Wahl eingeben. Nachdem Sie die URL eingegeben haben, wird das Bild über die Azure API analysiert, und die Ergebnisse werden in der rechten Spalte angezeigt.
Die Analyse hilft uns zu verstehen, was auf dem Bild dargestellt ist, und liefert wichtige Informationen, die später für die Generierung der Bildbeschreibung verwendet werden.
Hier sehen Sie die Ergebnisse der Bildanalyse. Diese Daten geben uns Einblick in die verschiedenen Elemente und Strukturen des Bildes.
Hier können spezifische Informationen über die Beeinträchtigung des Nutzers eingegeben werden, um die Generierung des Alt-Textes anzupassen. Es gibt auch eine Standardvoreinstellung, die über ein Dropdown-Menü geändert werden kann.
Mit den vorherigen Informationen können wir nun einen geeigneten Alt-Text für das Bild generieren. Dieser Text soll den Inhalt des Bildes so genau wie möglich beschreiben und für Menschen mit Beeinträchtigungen verständlich sein.
Nach der Generierung wird der Alt-Text unten angezeigt. Dieser Text kann als Alt-Text für das Bild auf einer Website verwendet werden. Er ermöglicht es Menschen mit Beeinträchtigungen, den Inhalt des Bildes zu verstehen. Unsere Vision ist es, diesen Prozess weiter zu automatisieren und zu verbessern, um das Internet für jeden zugänglich zu machen.
In diesem Abschnitt geht es um die Vereinfachung von Sprache. Das Ziel ist es, komplexen und schwer verständlichen Text in eine Form zu übertragen, die für alle leicht verständlich ist. Dies kann besonders nützlich für Menschen mit kognitiven Beeinträchtigungen sein, da sie Schwierigkeiten haben können, komplexe Informationen oder Sätze zu verarbeiten. Durch die Umwandlung in "leichte Sprache" (WCAG Erfolgskriterium 3.1.5) können Webseiten und Texte allgemein zugänglicher gemacht werden.
Sollte es nicht gewünscht sein, dass die Kontextinformationen aus Abschnitt 2.1. berücksichtigt werden, löschen Sie bitte den Inhalt aus diesen, oder wählen unter Abschnitt 1.1. 'Eigenes Szenario' aus.
In diesem Feld können Sie einen Text eingeben, der als kompliziert oder schwer verständlich empfunden wird. Das kann ein Fachjargon, lange Sätze oder komplexe Satzstrukturen beinhalten. Nach der Eingabe wird dieser Text mit Hilfe der KI in eine einfachere Formulierung umgewandelt.