News

Die von KI und Instagram generierten Bildunterschriften von Facebook und Instagram bieten jetzt weitaus mehr Details

Die von KI und Instagram generierten Bildunterschriften von Facebook und Instagram bieten jetzt weitaus mehr Details

Jedes auf Facebook und Instagram gepostete Bild erhält eine Beschriftung, die von einer Bildanalyse-KI generiert wurde, und diese KI ist jetzt viel schlauer. Das verbesserte System sollte eine Wohltat für sehbehinderte Benutzer sein und Ihnen helfen, Ihre Fotos in Zukunft schneller zu finden.

Alt-Text ist ein Feld in den Metadaten eines Bildes, das dessen Inhalt beschreibt: “Eine Person, die mit einem Pferd auf einem Feld steht” oder “ein Hund auf einem Boot”. Auf diese Weise kann das Bild von Personen verstanden werden, die es nicht sehen können.

Diese Beschreibungen werden häufig manuell von einem Fotografen oder einer Veröffentlichung hinzugefügt, aber Personen, die Fotos in soziale Medien hochladen, stören sich im Allgemeinen nicht, wenn sie überhaupt die Möglichkeit dazu haben. Die relativ junge Fähigkeit, automatisch eine zu generieren – die Technologie ist in den letzten Jahren gerade erst gut genug geworden – war äußerst hilfreich, um Social Media allgemein zugänglicher zu machen.

Facebook hat 2016 sein automatisches Alt-Text-System entwickelt, das vor Äonen im Bereich des maschinellen Lernens liegt. Das Team hat seitdem viele Verbesserungen vorgenommen, die es schneller und detaillierter machen. Das neueste Update bietet eine Option, um bei Bedarf eine detailliertere Beschreibung zu erstellen.

Das verbesserte System erkennt zehnmal mehr Elemente und Konzepte als zu Beginn, jetzt rund 1.200. Und die Beschreibungen enthalten mehr Details. Was früher “Zwei Personen an einem Gebäude” war, kann jetzt “Ein Selfie von zwei Personen am Eiffelturm” sein. (Die tatsächlichen Beschreibungen sichern sich mit “kann sein …” ab und vermeiden wilde Vermutungen.)

Aber es gibt mehr Details als das, auch wenn es nicht immer relevant ist. In diesem Bild notiert die KI beispielsweise die relativen Positionen der Personen und Objekte:

Die Facebook-Smartphone-App zeigt detaillierte Bildunterschriften für ein Bild.

Offensichtlich sind die Leute über den Trommeln, und die Hüte sind über den Leuten, von denen keiner wirklich gesagt werden muss, damit jemand das Wesentliche versteht. Aber betrachten Sie ein Bild, das als “Ein Haus und einige Bäume und ein Berg” beschrieben wird. Ist das Haus am Berg oder davor? Sind die Bäume vor oder hinter dem Haus oder vielleicht auf dem Berg in der Ferne?

Um das Bild angemessen zu beschreiben, sollten diese Details ausgefüllt werden, auch wenn die allgemeine Idee mit weniger Worten vermittelt werden kann. Wenn eine sehende Person mehr Details wünscht, kann sie genauer hinsehen oder auf das Bild klicken, um eine größere Version zu erhalten. Jemand, der dies nicht kann, hat jetzt eine ähnliche Option mit diesem Befehl “Detaillierte Bildbeschreibung generieren”. (Aktivieren Sie es mit einem langen Druck in der Android-App oder einer benutzerdefinierten Aktion in iOS.)

Vielleicht wäre die neue Beschreibung so etwas wie “Ein Haus und einige Bäume vor einem Berg mit Schnee darauf.” Das ergibt ein besseres Bild, oder? (Um klar zu sein, diese Beispiele sind zusammengestellt, aber es ist die Art von Verbesserung, die erwartet wird.)

Die neue detaillierte Beschreibungsfunktion wird zuerst zum Testen auf Facebook verfügbar sein, obwohl das verbesserte Vokabular bald auf Instagram erscheinen wird. Die Beschreibungen sind auch einfach gehalten, sodass sie problemlos in andere Sprachen übersetzt werden können, die bereits von den Apps unterstützt werden, obwohl die Funktion möglicherweise nicht gleichzeitig in anderen Ländern eingeführt wird.

Nachrichtenquelle

Tags

About the author

adler Leitz

adler Leitz

Er ist eines der Vorstandsmitglieder der ceosg. Er arbeitet hauptsächlich für die Community und hilft den Teams zu verstehen, was in Tech World passiert. Er liebt es, all seine Arbeitserfahrungen mit Lesern zu teilen, um sie über die neuesten Trends in der Technologie- und Geschäftswelt auf dem Laufenden zu halten.

Add Comment

Click here to post a comment