Das neueste KI-System von Microsoft kann Fotos automatisch anhand der darin enthaltenen Personen und Objekte sowie des Kontextes, in dem sie aufgenommen wurden, beschriften.
In der Entwicklung bei Microsoft Research ist es das Ziel des Projekts zu erklären, was auf einem Bild erscheint, was zu passieren scheint und wie sich eine Person möglicherweise fühlen könnte, sagten die Forscher.
Computer arbeiten bereits daran, die Inhalte von Fotos zu identifizieren, z. B. das automatische Tagging von Facebook und die Bildsuche von Google, mit der ähnliche Bilder anhand von Farben, Objekten und sogar Körperhaltungen abgeglichen werden können.
Die Facebook-eigene KI-Entwicklungsgruppe FAIR hat im vergangenen Jahr bekannt gegeben, dass ihre eigene KI Bilder in Fotos erkennen kann, während sie im April dieses Jahres damit begann, Fotos für Blinde über ihre eigene automatische alternative Text-Engine zu beschriften.
Um ein eigenes System aufzubauen, verwendeten die Forscher von Microsoft beispielsweise Deep-Learning-Methoden, um den Computer dazu zu bringen, anhand von Tausenden von Katzenbeispielen zu lernen, wie man Katzen auf Fotos identifiziert.
Wissenschaftler haben mehr als 8.100 neue Bilder in das Erzählsystem eingespeist, um zu analysieren, welche Geschichten daraus entstanden sind.
Ein Bildunterschriftenprogramm kann fünf Bilder aufnehmen und vorschlagen: “Dies ist ein Bild einer Familie; dies ist ein Bild eines Kuchens; dies ist ein Bild eines Hundes; dies ist ein Bild eines Strandes.”
Aber das Storytelling-Programm von Microsoft könnte dieselben Bilder aufnehmen und vorschlagen: “Die Familie traf sich zum Kochen; sie hatten viel leckeres Essen; der Hund war froh, dort zu sein; sie hatten eine tolle Zeit am Strand; sie hatten sogar eine im Wasser schwimmen. “
Das System befindet sich vorerst noch in einem frühen Stadium.
Die Forscher mussten abschätzen, wie effektiv das System bei der Erstellung von Geschichten war. Aufgrund der großen Anzahl von Geschichten, die der Computer generiert hat, wird eine automatisierte Methode verwendet. Sie fanden heraus, dass diese automatisierte Methode den Computer-Geschichtenerzähler als fast genauso leistungsfähig wie menschliche Geschichtenerzähler einstufte.
Das System hat es jedoch immer noch schwer, Wörter zu unterscheiden, und war in den ersten Tests geneigt, alles als “großartig” zu beschreiben.
Margaret Mitchell, leitende Autorin und Informatikerin bei Microsoft Research, sagte, die Zukunft dieser Technologie bestehe darin, “Menschen dabei zu helfen, ihre Erfahrungen auszutauschen und gleichzeitig die Arbeit zu reduzieren, die manche Menschen als ziemlich mühsam empfinden”.
Dies ist das neueste KI-Experiment von Microsofts Forschungsabteilung, das Anfang dieses Jahres auch den katastrophalen Tay-Chatbot auf Twitter losgelassen hat.
Amazon hat kürzlich mit dem Kauf von Orbeus, einer Bilderkennungsfirma, eine eigene KI-Abteilung aufgebaut.
Ausgewählte Ressourcen
Werden Sie ein digitaler Dienstleister
So transformieren Sie Ihr Unternehmen vom Netzwerkkern zum Edge
jetzt downloaden
Optimale Geschäftsergebnisse mit der Cloud
Bewertung der besten Ansätze für die Einführung hybrider Clouds
jetzt downloaden
Virtualisierung, die Entscheidungen ermöglicht, keine Kompromisse
Nutzen Sie die Virtualisierungstechnologie, die für Ihre Hybridinfrastruktur geeignet ist
jetzt downloaden
E-Mail-Sicherheitsbedrohungsbericht 2020
Vier wichtige Trends vom Speerfischen bis zum Diebstahl von Ausweisen
jetzt downloaden