Wie Maschinen sehen lernen – Verfahren zur Bilderkennung

Veröffentlicht: 25.09.2018
Kategorie: Grundlagen

Inhaltsverzeichnis

Dank neuer intelligenter Analyseverfahren zur Bilderkennung können visuelle Informationen, die eine enorme Quelle für unerschlossenes Wissen darstellen, zugänglich gemacht werden. Dadurch lassen sich zahlreiche Use Cases umsetzen, die auf Verfahren wie „Computer Vision“ beziehungsweise „Image Recognition“ basieren. Dabei gibt es eine entscheidende Herausforderung: Für einen Algorithmus ist es nicht immer einfach zu sagen, was genau auf einem Bild zu sehen ist. Auf den ersten Blick ist es manchmal sogar für Menschen schwer zu sagen, was auf bestimmten Bildern zu sehen ist, wie das folgende Beispiel zeigt.

Sogar für den Menschen ist es auf den ersten Blick schwierig zu unterscheiden, ob es sich um einen Muffin oder ein Chihuahua handelt.

(Quelle: freecodecamp.org)

Intelligente Software zur Bilderkennung muss darum trainiert werden. Dabei lösen lernfähige Algorithmen die Bilder in kleine Bestandteile auf und suchen nach Mustern in den Daten. Sind Programme zur Bilderkennung erst einmal trainiert, erledigen sie ihre Aufgabe sehr viel schneller und sehr viel genauer als Menschen. Da diese Lernphase aber mit einem gewissen Aufwand verbunden ist, sollte von Beginn an eine konkrete Fragestellung vorhanden sein und der wirtschaftliche Nutzen sichergestellt werden.

Bilddaten enthalten einen wahren Wissensschatz

Die ursprünglichste und am weitesten verbreitete Form von Daten sind Textdaten. Diese zu speichern und auszuwerten ist inzwischen überall Standard. Bilddaten stehen im Vergleich dazu erst seit vergleichsweise kurzer Zeit im Fokus von Datenanalysen. In den letzten Jahren sind Datenarchive, die auf Bilddaten basieren oder zumindest große Mengen an Bilddaten enthalten, extrem schnell gewachsen. Diesen Schatz an Wissen gilt es aktuell für die Unternehmen nutzbar zu machen.

Dabei sind visuelle Analyseverfahren eine der interessantesten Möglichkeiten, um schnell und effektiv an Informationen zu kommen. Insbesondere Dateiformate wie PDFs und diverse Bildformate bis hin zum Live-Video, enthalten wichtige Informationen, die mit neuen Verfahren zur Bilderkennung erschlossen werden können. Eines der aktuell bekanntesten Einsatzgebiete von Bilderkennungsverfahren ist sicher die Gesichtserkennung zum Entsperren von Smartphones.

Die Grundlagen der Bilderkennung

Bei der Entwicklung von Software und Algorithmen zur Bilderkennung spielt Künstliche Intelligenz beziehungsweise Machine Learning eine zentrale Rolle. Lernfähigen Programmen beizubringen, was auf Bildern zu sehen ist, ist durchaus mit Herausforderungen verbunden. Die Algorithmen müssen beim Lernvorgang Millionen von Bildern miteinander vergleichen, um ähnliche Muster auf den Bildern zu erkennen. Ein aufwändiger und ressourcen-intensiver Prozess. Vor allem der nächste Schritt – die Zuordnung von Mustern und abstrakten Konzepten und Begriffen ist dabei am schwierigsten.

Das lässt sich an einem klassischen Beispiel aus dem Philosophie-Unterricht zeigen, das allerdings durchaus konkrete Relevanz etwa im Bereich Handel oder eCommerce hat. Wenn wir versuchen, einem Algorithmus beizubringen, Tische auf Bildern zu erkennen, muss es beim Lernvorgang eine Definition vom Bildinhalt „Tisch“ geben. So eine Definition könnte lauten: Ein Gegenstand mit einer großen Oberfläche und vier Beinen. Ein Tisch kann aber auch drei Beine haben oder auch nur eines. Und auch ein Stuhl kann aussehen wie ein Tisch – um all diese Unterschiede zu „verstehen“, braucht der Algorithmus Feedback.

Bilderkennung in der Praxis: Use Case „Hagelschaden“

Für einen unserer Kunden aus der Versicherungsbranche, haben wir ein Projekt realisiert, bei dem wir durch den Einsatz von Bilderkennung den Zeitaufwand für die Begutachtung von Schäden um 75 % reduzieren konnten.

Die Herausforderung bestand darin, Schäden, die durch Naturkatastrophen verursacht werden, schnell und effektiv zu beurteilen. Denn gerade in diesen Fällen sollte den Kunden zeitnah geholfen werden. Am Beispiel von Hagelschäden lässt sich verdeutlichen, wie dies durch den Einsatz von Systemen mit Bilderkennung realisieren lässt.

Bislang mussten Sachbearbeiter in die betroffenen Regionen fahren, um die Schäden persönlich zu beurteilen. Ein sehr zeitaufwändiger Prozess. Wir haben darum ein System entwickelt, mit dem wir nach einem Unwetter einzelne Regionen untersuchen können, in dem Satellitenbilder ausgewertet werden. Dazu musste ein Algorithmus so trainiert werden, dass er Häuser mit intakten Dächern von solchen mit nicht intakten Dächern unterscheiden kann.

Wenn von Versicherten aus einer bestimmten Region ein Schaden gemeldet wird, verfügt der Versicherer über eine ausreichende Datengrundlage, um einen Fall zeitnah zu beurteilen. Die Behebung von Schäden wird dadurch sehr viel schneller möglich. Die Schadensregulierung wird von mehreren Monaten auf wenige Tage reduziert. Auch im Langzeiteinsatz ergeben sich weitere Vorteile:

Die Zufriedenheit der Kunden wächst, weil Schadensfälle schnell geregelt werden.
Der Versicherer erhält eine sehr genaue Datengrundlage zur verbesserten, zukünftigen Risikoabschätzung.

So nutzen Sie das Potenzial visueller Informationen

Die verbesserten Verfahren zur Bilderkennung erlauben es insbesondere im Zeitalter von Künstlicher Intelligenz, Bilddaten verstärkt auszuwerten. Visuelle Informationen sind extrem reichhaltig, sind sehr schnell verfügbar und haben den Vorteil, dass sie in der Regel in sehr großen Mengen verfügbar sind (Big Data). Dadurch kann ein enormer Bestandteil von Daten erschlossen werden, der über viele Jahre von Datenanalysen ausgeschlossen blieb, weil es schwierig war, die darin enthaltenen Informationen effektiv zu extrahieren. Heute sind solche Verfahren zur Bilderkennung jedoch verfügbar und ihr Einsatz wirtschaftlich, wodurch sich eine große Bandbreite von neuen Anwendungsfeldern eröffnet:

Objekterkennung und Verfolgung
Lage- und Positionserkennung
Größen- und Formenvermessung
Oberflächenprüfung
Mustererkennung
Schrifterkennung
Barcodeerkennung
Vollständigkeits- oder Füllstands-Prüfung
Verkehrskontrolle und Lenkung
Personenerkennung

Viele Prozesse, die ganz oder teilweise auf visuellen Informationen aufbauen, können durch neue Verfahren zur Bilderkennung optimiert oder vollständig umgestaltet werden. Da es sich dabei um zum Teil sehr komplexe Informationen handelt, ist sowohl der Erkenntnisgewinn als auch der wirtschaftliche Nutzen enorm.

Diesen Beitrag teilen:

Anbieter:	HubSpot, Inc., 25 First Street, Cambridge, MA 02141, USA
Cookiename:	__hstc; hubspotutk; __hssc; __hssrc; __cf_bm; __cfruid
Laufzeit:	6 Monate; 6 Monate; 30 Minuten; Sitzungsende; 30 Minuten; Sitzungsende
Datenschutzlink:	https://legal.hubspot.com/de/privacy-policy
Host:	.hubspot.com

Anbieter:	InnoCraft Ltd., 150 Willis St, 6011 Wellington, New Zealand
Cookiename:	_pk_id..; _pk_ses..
Laufzeit:	13 Monate; 30 Minuten
Datenschutzlink:	https://matomo.org/gdpr-analytics/
Host:	.matomo.cloud

Anbieter:	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Cookiename:	YSC; VISITOR_INFO1_LIVE; PREF
Laufzeit:	Sitzungsende; 6 Monate; 8 Monate
Datenschutzlink:	https://policies.google.com/privacy?hl=de
Host:	.youtube.com

Anbieter:	Podigee GmbH, Revaler Straße 28, 10245 Berlin, Deutschland
Cookiename:	Nicht spezifiziert
Laufzeit:	Nicht spezifiziert
Datenschutzlink:	https://www.podigee.com/de/ueber-uns/datenschutz/
Host:	.podigee.com

Anbieter:	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Irland
Cookiename:	SID; HSID; NID
Laufzeit:	2 Jahre; 2 Jahre; 6 Monate
Datenschutzlink:	https://policies.google.com/privacy?hl=de
Host:	.google.com