Wie Maschinen sehen lernen – Verfahren zur Bilderkennung

von | 25. September 2018 | Grundlagen

Dank neuer intelligenter Analyseverfahren zur Bilderkennung können visuelle Informationen, die eine enorme Quelle für unerschlossenes Wissen darstellen, zugänglich gemacht werden. Dadurch lassen sich zahlreiche Use Cases umsetzen, die auf Verfahren wie „Computer Vision“ beziehungsweise „Image Recognition“ basieren. Dabei gibt es eine entscheidende Herausforderung: Für einen Algorithmus ist es nicht immer einfach zu sagen, was genau auf einem Bild zu sehen ist. Auf den ersten Blick ist es manchmal sogar für Menschen schwer zu sagen, was auf bestimmten Bildern zu sehen ist, wie das folgende Beispiel zeigt.

Sogar für den Menschen ist es auf den ersten Blick schwierig zu unterscheiden, ob es sich um einen Muffin oder ein Chihuahua handelt.

Bilderkennung
(Quelle: freecodecamp.org)

Intelligente Software zur Bilderkennung muss darum trainiert werden. Dabei lösen lernfähige Algorithmen die Bilder in kleine Bestandteile auf und suchen nach Mustern in den Daten. Sind Programme zur Bilderkennung erst einmal trainiert, erledigen sie ihre Aufgabe sehr viel schneller und sehr viel genauer als Menschen. Da diese Lernphase aber mit einem gewissen Aufwand verbunden ist, sollte von Beginn an eine konkrete Fragestellung vorhanden sein und der wirtschaftliche Nutzen sichergestellt werden.

Linktipp: Sie suchen nach Inspirationen für mögliche Use Cases von Machine Learning? Hier stellen wir fünf Anwendungsfälle für die Industrie 4.0 vor.

Bilddaten enthalten einen wahren Wissensschatz

Die ursprünglichste und am weitesten verbreitete Form von Daten sind Textdaten. Diese zu speichern und auszuwerten ist inzwischen überall Standard. Bilddaten stehen im Vergleich dazu erst seit vergleichsweise kurzer Zeit im Fokus von Datenanalysen. In den letzten Jahren sind Datenarchive, die auf Bilddaten basieren oder zumindest große Mengen an Bilddaten enthalten, extrem schnell gewachsen. Diesen Schatz an Wissen gilt es aktuell für die Unternehmen nutzbar zu machen.

Dabei sind visuelle Analyseverfahren eine der interessantesten Möglichkeiten, um schnell und effektiv an Informationen zu kommen. Insbesondere Dateiformate wie PDFs und diverse Bildformate bis hin zum Live-Video, enthalten wichtige Informationen, die mit neuen Verfahren zur Bilderkennung erschlossen werden können. Eines der aktuell bekanntesten Einsatzgebiete von Bilderkennungsverfahren ist sicher die Gesichtserkennung zum Entsperren von Smartphones.

Die Grundlagen der Bilderkennung

Bei der Entwicklung von Software und Algorithmen zur Bilderkennung spielt Künstliche Intelligenz beziehungsweise Machine Learning eine zentrale Rolle. Lernfähigen Programmen beizubringen, was auf Bildern zu sehen ist, ist durchaus mit Herausforderungen verbunden. Die Algorithmen müssen beim Lernvorgang Millionen von Bildern miteinander vergleichen, um ähnliche Muster auf den Bildern zu erkennen. Ein aufwändiger und ressourcen-intensiver Prozess. Vor allem der nächste Schritt – die Zuordnung von Mustern und abstrakten Konzepten und Begriffen ist dabei am schwierigsten.

Das lässt sich an einem klassischen Beispiel aus dem Philosophie-Unterricht zeigen, das allerdings durchaus konkrete Relevanz etwa im Bereich Handel oder eCommerce hat. Wenn wir versuchen, einem Algorithmus beizubringen, Tische auf Bildern zu erkennen, muss es beim Lernvorgang eine Definition vom Bildinhalt „Tisch“ geben. So eine Definition könnte lauten: Ein Gegenstand mit einer großen Oberfläche und vier Beinen. Ein Tisch kann aber auch drei Beine haben oder auch nur eines. Und auch ein Stuhl kann aussehen wie ein Tisch – um all diese Unterschiede zu „verstehen“, braucht der Algorithmus Feedback.

Bilderkennung in der Praxis: Use Case „Hagelschaden“

Für einen unserer Kunden aus der Versicherungsbranche, haben wir ein Projekt realisiert, bei dem wir durch den Einsatz von Bilderkennung den Zeitaufwand für die Begutachtung von Schäden um 75 % reduzieren konnten.

Die Herausforderung bestand darin, Schäden, die durch Naturkatastrophen verursacht werden, schnell und effektiv zu beurteilen. Denn gerade in diesen Fällen sollte den Kunden zeitnah geholfen werden. Am Beispiel von Hagelschäden lässt sich verdeutlichen, wie dies durch den Einsatz von Systemen mit Bilderkennung realisieren lässt.

Bislang mussten Sachbearbeiter in die betroffenen Regionen fahren, um die Schäden persönlich zu beurteilen. Ein sehr zeitaufwändiger Prozess. Wir haben darum ein System entwickelt, mit dem wir nach einem Unwetter einzelne Regionen untersuchen können, in dem Satellitenbilder ausgewertet werden. Dazu musste ein Algorithmus so trainiert werden, dass er Häuser mit intakten Dächern von solchen mit nicht intakten Dächern unterscheiden kann.

Wenn von Versicherten aus einer bestimmten Region ein Schaden gemeldet wird, verfügt der Versicherer über eine ausreichende Datengrundlage, um einen Fall zeitnah zu beurteilen. Die Behebung von Schäden wird dadurch sehr viel schneller möglich. Die Schadensregulierung wird von mehreren Monaten auf wenige Tage reduziert. Auch im Langzeiteinsatz ergeben sich weitere Vorteile:

  1. Die Zufriedenheit der Kunden wächst, weil Schadensfälle schnell geregelt werden.
  2. Der Versicherer erhält eine sehr genaue Datengrundlage zur verbesserten, zukünftigen Risikoabschätzung.

So nutzen Sie das Potenzial visueller Informationen

Die verbesserten Verfahren zur Bilderkennung erlauben es insbesondere im Zeitalter von Künstlicher Intelligenz, Bilddaten verstärkt auszuwerten. Visuelle Informationen sind extrem reichhaltig, sind sehr schnell verfügbar und haben den Vorteil, dass sie in der Regel in sehr großen Mengen verfügbar sind (Big Data). Dadurch kann ein enormer Bestandteil von Daten erschlossen werden, der über viele Jahre von Datenanalysen ausgeschlossen blieb, weil es schwierig war, die darin enthaltenen Informationen effektiv zu extrahieren. Heute sind solche Verfahren zur Bilderkennung jedoch verfügbar und ihr Einsatz wirtschaftlich, wodurch sich eine große Bandbreite von neuen Anwendungsfeldern eröffnet:

  • Objekterkennung und Verfolgung
  • Lage- und Positionserkennung
  • Größen- und Formenvermessung
  • Oberflächenprüfung
  • Mustererkennung
  • Schrifterkennung
  • Barcodeerkennung
  • Vollständigkeits- oder Füllstands-Prüfung
  • Verkehrskontrolle und Lenkung
  • Personenerkennung

Viele Prozesse, die ganz oder teilweise auf visuellen Informationen aufbauen, können durch neue Verfahren zur Bilderkennung optimiert oder vollständig umgestaltet werden. Da es sich dabei um zum Teil sehr komplexe Informationen handelt, ist sowohl der Erkenntnisgewinn als auch der wirtschaftliche Nutzen enorm.

Autor:innen

Michaela Tiedemann

Michaela Tiedemann ist seit den jungen Startup Tagen der Alexander Thamm GmbH mit im Team. Sie hat die Entwicklung vom schnelllebigen, spontanen Startup hin zum erfolgreichen Unternehmen aktiv mitgestaltet. Mit der Gründung einer eigenen Familie begann für Michaela Tiedemann dann parallel dazu ein ganz neues Kapitel. Den Job an den Nagel zu hängen, kam für die frisch gebackene Mutter aber nicht in Frage. Stattdessen entwickelte sie eine Strategie, wie sie ihre Stelle als Chief Marketing Officer mit ihrer Rolle als Mutter in Einklang bringen kann.

0 Kommentare

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert