AlphaFold

Was ist AlphaFold?

AlphaFold ist eine Künstliche Intelligenz, welche in der Lage ist, die dreidimensionale Proteinstruktur nur mithilfe der Aminosäuresequenz des Proteins vorherzusagen. 2020 hat AlphaFold2 die Genauigkeit von experimentellen Methoden erreicht und damit ein 50 Jahre altes Problem der Biologie gelöst: das Problem der Proteinfaltung.

Seit 2021 steht AlphaFold DB als Datenbank von Proteinstrukturen für Wissenschaftler auf der ganzen Welt frei zur Verfügung. Zudem kann eine kostenlose Version von AlphaFold2 als Open-Source-Software bei Github genutzt werden.

Die Lösung für das „protein folding problem“ (Proteinfaltungsproblem)

AlphaFold ist eine weitere Erfolgsgeschichte von Google DeepMind (AlphaGo, AlphaZero und Ithaca). Kurz nachdem AlphaGo den berühmten Profispieler Lee Sedol in Go deutlich besiegt hat, wurde 2016 ein neues Team von DeepMind zusammengestellt. Dessen Ziel war es, das Problem der Proteinstrukturvorhersage zu lösen.

2018 markiert den ersten Erfolg des Teams: AlphaFold belegt den ersten Platz bei dem 13. CASP-Wettbewerb.

Die CASP; Critical Assessment of Techniques for Protein Structure Prediction (zu Deutsch: kritische Bewertung von Techniken zur Vorhersage von Proteinstrukturen) ist ein Zusammenschluss von Wissenschaftlern, die seit 1994 die Problematik der Proteinfaltung erforschen. Alle zwei Jahre findet ein Wettbewerb statt, in dem Forschungsteams eine Auswahl an Aminosäuresequenzen für Proteine vorgegeben bekommen. Deren genaue dreidimensionale Form ist bereits bekannt, aber nicht öffentlich zugänglich. Die Teams geben ihre besten Vorhersagen ab, um zu sehen, wie nah sie an den tatsächlichen Strukturen sind.

Die hervorragenden Ergebnisse von AlphaFold bei diesem Wettbewerb werden in der Fachzeitschrift Nature veröffentlicht und das Team von DeepMind wird weiter vergrößert. 2020 ist der Durchbruch geschafft: AlphaFold2 gewinnt den 14. CASP-Wettbewerb mit großem Vorsprung und wird von den Organisatoren der CASP als Lösung für das 50 Jahre alte „protein folding problem“ (Proteinfaltungsproblem) anerkannt. AlphaFold2 kann die Proteinstrukturen bis auf atomare Genauigkeit mit einem mittleren Fehler (RMSD_95) von weniger als 1 Angström vorhersagen und ist damit dreimal genauer als das nächstbeste System und vergleichbar mit experimentellen Methoden. In der Fachwelt wird die Lösung des Proteinfaltungsproblems als eine der wichtigsten Errungenschaft seit der Kartierung des menschlichen Genoms betitelt.

Wie funktioniert AlphaFold?

Grundsätzlich nutzt AlphaFold Neuronale Netze welche durch Deep Learning trainiert werden. Nach den sehr guten Ergebnissen bei CASP13, wird das Programm weiterentwickelt. Dessen Methoden und der Code werden in der Fachzeitschrift Nature veröffentlicht. Daraus resultieren Open-Source-Implementierungen aus der Community. DeepMind selbst hat neue Deep-Learning-Architekturen hinzugefügt und die Methoden weiterentwickelt.

Ausschlaggebend für diese Methoden sind die Fachbereiche Biologie, besonders im Gebiet der Proteinfaltung, sowie Physik und maschinelles Lernen.

Für das Verständnis der physikalischen Wechselwirkungen innerhalb von Proteinen ist es wichtig zu verstehen, wie ein gefaltetes Protein aufgebaut ist. Es kann als „räumlicher Graph“ gesehen werden, in dem Reste die Knoten sind und Kanten die Reste in unmittelbarer Nähe verbinden. Für AlphaFold2, welches CASP14 gewinnt, wird ein aufmerksamkeitsbasiertes neuronales Netzwerksystem genutzt. Damit versucht es kontinuierlich, die Struktur des Proteins zu interpretieren, während es über das Diagramm, welches es gerade zusammenfügt, nachdenkt. Zur Verbesserung dieses Diagramms werden Multiple Sequence Alignment (kurz MSA; zu Deutsch: Multiple Sequenzalignierung) und eine Darstellung von Aminosäurerestpaaren verwendet.

Durch ständiges Wiederholen dieses Prozesses erzielt AlphaFold2 starke Vorhersagen der Proteinstruktur. Durch ein eigenes Konfidenzmaß ist AlphaFold2 außerdem in der Lage zu bestimmen, welche Teile seiner vorhergesagten Proteinstruktur als zuverlässig einzustufen sind.

AlphaFold Protein Structure Database

In enger Zusammenarbeit mit dem European Bioinformatics Institute am European Molecular Biology Laboratory (EMBL-EBI) startet DeepMind 2021 die AlphaFold Protein Structure Database. Damit hat die wissenschaftliche Gemeinschaft freien und offenen Zugang zum menschlichen Proteom (die Gesamtheit aller Proteine des menschlichen Körpers) zusammen mit 20 weiteren Modellorganismen, unter anderem von Mäusen. Damit umfasst die Datenbank insgesamt über 350.000 Strukturen. Anfang 2022 fügt DeepMind weitere 27 Proteome (das entspricht über 190.000 Proteinen) der Datenbank hinzu.

Bis heute haben über 300.000 Forscher weltweit von der Datenbank Gebrauch gemacht. Damit stellt AlphaFold einen der bedeutendsten Beiträge von KI zur Förderung der wissenschaftlichen Erkenntnisse dar.

AlphaStar

Was ist AlphaStar?

AlphaStar ist die erste Künstliche Intelligenz, welche das Echtzeitstrategiespiel StarCraft 2 auf überragendem Niveau beherrscht. Dafür nutzt es maschinelles Lernen und tiefe neuronale Netze. Nach AlphaGo, AlphaZero und AlphaFold ist AlphaStar ein weiterer Erfolg von Google DeepMind.

Was ist StarCraft 2?

StarCraft 2 ist ein Echtzeitstrategiespiel von Blizzard Entertainment und gilt als eines der komplexesten und beliebtesten aller E-Sports-Spiele. Beim Spielen müssen einige Dinge beachtet werden:

Activision Blizzard

1. Micro-Management, auch Micro genannt: Der Spieler muss permanent Dutzende Spielfiguren gleichzeitig auf dem Spielfeld lenken und Befehle erteilen.

2. Macro-Management, kurz Macro genannt: Der Spieler muss eine passende Strategie zum Errichten von Gebäuden, dem Erforschen von Upgrades und dem Bau neuer Spielfiguren entwickeln.

3. Unvollständige Informationen: durch den „Nebel des Krieges“ sind die Aktionen des Gegners meist nicht sichtbar. Eigene Einheiten lassen den Nebel in einem kleinen Umkreis verschwinden. Daher muss man diese in Gebiete des Gegners schicken, um einen Blick auf dessen Taktik werfen zu können. Diese Aktion nennt sich „Scouting“.

4. Das Schere-Stein-Papier-Prinzip: auf jeden Angriff kann mit einer passenden Verteidigung geantwortet werden. Daraus ergibt sich wiederum ein Vorteil für den Gegenangriff.

5. Alles geschieht in Echtzeit: Anders als bei Schach oder Go, müssen beide Spieler gleichzeitig und ohne Pause ihre Aktionen planen und durchführen.

6. Drei verschiedene Rassen: Es gibt drei verschiedene Alien-Rassen, aus denen zu Beginn des Spiels gewählt wird: Protoss,Terran und Zerg. Alle haben ihre Eigenheiten und ermöglichen unterschiedliche Strategien.

Funktion und Spielstärke von AlphaStar

Für Künstliche Intelligenzen stellt diese Vielschichtigkeit eine große Herausforderung dar. AlphaStar muss jedes Mal aus bis zu 1026 möglichen Aktionen wählen, wobei es dazu noch viele Spielzüge gibt, deren Auswirkungen erst nach langer Spielzeit abzusehen sind. Um erfolgreiche Strategien für den Sieg zu entwickeln, musste AlphaStar menschliche Strategien erlernen und weiter erforschen.

Dazu nutzt es verschiedene allgemeine Techniken des maschinellen Lernens, unter anderem das Selbstspiel mit verstärkendem Lernen (reinforcement Learning) und Imitationslernen, kombiniert mit Neuronalen Netzen. Damit schafft es AlphaStar einen Grandmaster-Level für alle drei Alien-Rassen zu erlangen und spielt besser als 99,8 % der StarCraft-Spieler auf Battle.net.

Die starken Ergebnisse von AlphaStar liefern Beweise dafür, wie allgemeine Lerntechniken KI-Systeme stärken können, sodass sie in dynamischen und komplexen Umgebungen funktionieren können. Diese Ergebnisse sollen in Zukunft auch in der realen Welt anwendbar sein und damit KIs sicherer und robuster machen.

Online-Ressourcen

Github

Seit 2017 gibt es das StarCraft-API PySC2 als Open-Source bei Github. Es entstand aus einer Kooperation von DeepMind und Blizzard Entertainment. Durch die API können Computer mithilfe von Feature-Karten direkt Informationen erhalten, ohne die Spielgrafik auswerten zu müssen. Eine Feature-Karte kann beispielsweise aus einer Matrix bestehen, dessen Zellen den Typ einer Spielfigur anzeigt (zum Beispiel 0 für „keine Spielfigur“). Diese Daten sind für Computer wesentlich leichter zu verarbeiten. Diverse Künstliche Intelligenzen nutzen seitdem das API PySC2 und treten als StarCraft-Bots gegeneinander an.

Nature

In der Fachzeitschrift Nature hat DeepMind seine Forschungsergebnisse zu AlphaStar veröffentlicht. Darin finden sich Informationen zu den von AlphaStar genutzten Techniken und deren Nutzen.

Autonomes Fahren

Was ist autonomes Fahren?

Autonomes Fahren beschreibt grundsätzlich das Steuern eines Fahrzeugs oder Systems ohne Fahrer. Dabei ist der Begriff keinesfalls auf Automobile beschränkt, sondern auch auf Roboter oder Transportsysteme anzuwenden, obgleich der Begriff im Automobilsektor weitverbreitet ist.

5 Level autonomen Fahrens

Der Automatisierungsgrad wird anhand eines international standardisierten Levels von 0 bis 5 eingeteilt. Level 0 beschreibt dabei den Selbstfahrer, welcher ohne Hilfe von Fahrassistenzsystemen fährt. Die Level 1 bis 5 des autonomen Fahrens werden nachfolgend beschrieben:

  • Bei Level 1 (Assistiertes Fahren) übernimmt das System gewisse Aufgaben der Fahrzeugführung, wobei der Fahrer jederzeit in der Lage sein muss, die vollständige Kontrolle des Fahrzeugs zu übernehmen. Beispiel hierfür ist der Einsatz eines Tempomaten, Spurhalte- oder Abstandsassistenten.
  • Level 2 (Teilautomatisiertes Fahren) befähigt das Fahrzeug, Aufgaben des Fahrtbetriebs temporär vom Fahrer zu übernehmen. Beispiele hierfür sind der Überholassistent oder das automatische Einparken, bei welchem der Fahrer die Hände vom Lenkrad nehmen darf, dennoch jederzeit die Kontrolle über das Fahrzeug übernehmen können muss.
  • Autonomes Fahren Level 3 (Hochautomatisiertes Fahren) geht bezüglich der Fahraufgaben, welches das System ohne den Eingriff des Menschen bewerkstelligen kann, einen Schritt weiter. So darf sich der Fahrer vorübergehend vom Verkehr abwenden und beispielsweise Zeitung lesen oder sich um Passagiere auf dem Rücksitz kümmern. Der Fahrer muss jedoch in der Lage sein, die Führung des Fahrzeugs nach einer ausreichenden Zeitreserve wieder zu übernehmen. Die Fahrzeughersteller legen dabei die Bedingungen für den Betrieb des hochautomatisierten Fahrens fest. Dafür bieten sich insbesondere Autobahnen an, da es hier zu keinem Gegenverkehr kommt und die Bodenmarkierungen in der Regel gut sichtbar sind.
  • In Stufe 4 (Vollautomatisiertes Fahren) nimmt der Automatisierungsgrad des Fahrzeugs um weitere Komponenten zu. Autonomes Fahren Level 4 erlaubt es dem Fahrer, die Steuerung des Fahrzeugs komplett abzugeben. Selbst die Anwesenheit eines Passagiers während der Fahrt ist nicht notwendig, sodass auch selbstständige Einparkvorgänge oder Autobahnfahrten des Fahrzeugs möglich sind. Sofern das System an sein Grenzen stößt, ist es in der Lage, einen sicheren Zustand wie einen Parkplatz oder den Fahrbahnrand zu erreichen. Der Fahrer hat bei dieser Stufe jedoch nach wie vor die Möglichkeit, sämtliche Fahraufgaben selbst zu übernehmen.
  • In der letzten Stufe 5 (Autonomes Fahren) des Automatisierungsgrads wird der Fahrtbetrieb lediglich durch das System gesteuert, wodurch alle Fahrzeuginsassen dauerhaft zu Passagieren werden und keine Fahraufgaben mehr übernehmen, da das System sämtlichen Situation eigenständig löst.

Wo stehen wir heute?

Während Funktionen des autonomen Fahrens der Level 1 und 2 in den meisten Neuwägen bereits weitverbreitet sind, bietet Mercedes-Benz als erstes Hersteller ein zugelassenes System Stufe 3 für die S-Klasse sowie EQS für den Verkauf in Deutschland an. Der Drive Pilot kann in definierten Situationen auf Autobahnen bis zu einer Geschwindigkeit von 60 km/h aktiviert und genutzt werden.

Auch andere deutsche Autohersteller bzw. Zulieferer wie Audi, BMW, VW oder Bosch forschen und einwickeln teilweise in Kooperationen auf dem Gebiet des autonomen Fahrens. Einige Technologieunternehmen wie Google (mit ihrer Tochterfirma Waymo) und Apple forschen intensiv auf diesem Gebiet. Tesla liefert aktuell ihre Fahrzeuge mit einem Hardwarestand aus, welcher autonomes Fahren Level 5 erlauben würde, mangels Zulassung wird dies jedoch nicht aktiviert.

Auf dem Gebiet der Transportlogistik wie bei MAN oder DB Schenker wird an fahrerlosen Transportfahrzeugen geforscht.

Neben den technischen Voraussetzungen zu den einzelnen Stufen des autonomen Fahrens, spielt auch die rechtliche Komponente eine entscheidende Rolle, wobei der VDA (Verband der Automobilindustrie) dahingehend unterstützt einen Regelungsrahmen zu schaffen, um am Standort Deutschland als Technologietreiber aufzutreten.

Inhalt der VDA-Leitinitiative

Die VDA Leitinitiative autonomes und vernetztes Fahren (AVF) hat sich zum Ziel gesetzt, durch Kooperation und erhöhte Transparenz in der vorwettbewerblichen Grundlagenforschung den Standort Deutschland für automatisiertes und vernetztes Fahren durch breiten Kompetenzaufbau zu stärken. Die Leitinitiative soll dabei die Entwicklungsbedarfe und Förderschwerpunkte koordinieren, Synergien zwischen Projekten gehoben und Redundanzen sowie Fehlinvestitionen vermieden werden.

AlphaZero

Was ist AlphaZero?

AlphaZero ist ein selbstlernendes Computerprogramm von Google DeepMind, welches die Brettspiele Go, Schach und Shogi mithilfe seines Algorithmus erlernt. Dafür kombiniert es maschinelles Lernen mit neuronalen Netzen. Zum Erlernen eines der genannten Brettspiele, benötigt die Künstliche Intelligenz nur die Spielregeln, Spielbedingungen und intensives Spielen gegen sich selbst. Das Anlernen durch den Menschen ist nicht nötig.

AlphaZero basiert auf dem Ansatz von AlphaGo Zero, welches auch von DeepMind entwickelt wurde.

Wie leistungsfähig ist das Programm?

Da AlphaZero selbst lernt, steigert sich dessen Leistung mit jedem ausgetragenen Spiel. Es kennt nur die jeweiligen Spielregeln und beginnt mit Zufallszügen gegen sich selbst zu spielen. Es bewertet seine Züge nach dem Ergebnis und lernt so, welche Strategien bestmöglich funktionieren.

Bereits nach 4 Stunden war AlphaZero in der Lage, Schach auf übermenschlichen Niveau zu spielen und hat die Spielstärke von Schach-Weltmeister Magnus Carlsen mit einer Elo-Zahl von über 2800 übertroffen. Nach 9 Stunden Training hat es auch das bis dahin beste Schachprogramm Stockfish 8 mit einer kalkulierten Elo-Zahl von 3300 übertroffen.

Nach 34 Stunden hat AlphaZero die Brettspiele Schach, Shogi und Go gemeistert und alle bis dahin führenden Programme herausgefordert. Neben den Sieg gegen Stockfisch 8 im Schach, hat es Elmo im Shogi und AlphaGo im Go besiegt.

Dabei ist aber zu beachten, dass für die immense Zahl an Spielen gegen sich selbst, sehr viel Rechenleistung nötig ist. Um dies zu ermöglichen, wurde eine große Menge an TPUs (Tensor-Prozessoren, um Anwendungen des maschinellen Lernens zu beschleunigen) von Google genutzt. Damit konnte AlphaZero ungefähr 44 Millionen Schachspiele in 9 Stunden, 24 Millionen Shogi-Spiele in 12 Stunden und 21 Millionen Go-Spiele in 34 Stunden durchführen, wodurch sich der extrem rasante Lernerfolg von AlphaZero relativiert.

Wichtige Partien

AlphaZero und Stockfish

Stockfish ist ein Schachprogramm, welches, im Gegensatz zu AlphaZero, vom Menschen trainiert wurde und als Open Source kostenlos zur Verfügung steht. Der Algorithmus von Stockfish nutzt ein riesiges Repertoire aus Spielzügen, welche es durch das Spielen gegen menschliche Spieler gelernt hat. AlphaZero fehlt dieser menschliche Einfluss, wodurch die Spielweise als unkonventionell gilt.

2017 war Stockfish 8 das beste Schachprogramm und wurde von AlphaZero deutlich geschlagen. Damit sollte bewiesen werden, dass ein selbstlernender Algorithmus einem durch Menschen trainierten Algorithmus überlegen ist.

2021 ist Stockfish 14 (die neueste Version) wieder die Nummer 1 unter den Schachprogrammen, was unter anderem durch die Kooperation mit Leela Chess Zero und die Nutzung von neuronalen Netzen möglich wurde.

AlphaZero und Leela Chess Zero

Leela Chess Zero (kurz Lc0) ist ein Schachprogramm, welches kostenlos als Open Source genutzt werden kann, genau wie Stockfish. In seiner Funktionsweise wurde es aber AlphaZero nachempfunden. Leela Chess Zero basiert auf Leela Zero Go, welches wiederum Alpha Go Zero als Vorbild hat. Dementsprechend nutzt Lc0 seine Künstliche Intelligenz kombiniert mit maschinellen Lernen und neuronalen Netzen, um Schach zu erlernen. Eine der Hauptzwecke für die Entwicklung von Leela Chess Zero ist nämlich, die Methodik von AlphaZero zu bestätigen.

Es gibt kein offizielles Match von AlphaZero gegen Leela Chess Zero. Dafür tritt Lc0 regelmäßig gegen Stockfish an und ist mittlerweile auf ähnlichen Niveau. 2021 war Lc0 in der Rangliste der besten Schachprogramme auf Platz 2, hinter Stockfish 14.

AIOps

Was ist AIOps?

Zum einen steht AIOps für Artificial Intelligence for IT Operations – zu Deutsch: „Künstliche Intelligenz für den IT-Betrieb“. Dabei handelt es sich um eine Unterkategorie der Künstlichen Intelligenz, die von dem US-amerikanischen Forschungs- und Beratungsunternehmen Gartner 2016 erschaffen wurde.

Zum anderen wird das Akronym durch die Bedeutung „Algorithmischer IT-Betrieb“ ergänzt – was so viel bedeutet wie der Einsatz von maschinellem Lernen für Analysezwecke.

Der Bedarf dieses speziellen Feldes erklärt sich durch die moderne IT-Landschaft. Statische und vorhersehbare Systeme müssen Software-Umgebungen weichen, die sich im laufenden Betrieb ändern und neu konfigurieren. Zudem werden Daten zukünftig seltener in Rechenzentren oder Clouds generiert, sondern von Milliarden vernetzter IoT-Geräte. Vor diesem Hintergrund ist die Installation von AIOps innerhalb von Unternehmen mit breiter digitaler Infrastruktur unausweichlich, um konkurrenzfähig zu bleiben.

Inwiefern unterscheidet sich AIOps von DevOps?

DevOps beschreibt die Arbeitskultur, die nötig ist, um effizient und effektiv Software-Systeme zu entwickeln. Dazu gehören Methoden, wie automatisierte Entwicklungsabläufe, die agile Zusammenarbeit im Team oder entkoppelte Prozesse, die über Programmierschnittstellen miteinander kommunizieren.

AIOps bezieht sich ebenso auf die Kultur als Voraussetzung für eine zielgerichtete Entwicklung von Software. Auch Themen wie Scrum, Entwicklungspipelines oder Automatisierung (sie werden ansonsten mit DevOps in Verbindung gebracht) spielen hier eine große Rolle. Jedoch liegt der Fokus auf dem Einsatz von Big Data und maschinellem Lernen – also der Arbeit mit Künstlicher Intelligenz –, um unter anderem folgende IT-Betriebsprozesse zu analysieren und zu optimieren:

  • Bei der Ereigniskorrelation werden sogenannte Events überwacht. Das sind Anmeldungen und Ereignisse, die bei einer Computersitzung durchgeführt werden. Das Ziel dabei ist, Betriebsfehler zu identifizieren und Ursachen aufzudecken.
  • Als weitere Maßnahme der Gefahrenabwehr wird die Anomalieerkennung im Rahmen von AIOps eingesetzt. Während sich die Ereigniskorrelation auf das Erkennen von bereits bekannten Gefahren konzentriert, erfasst die Anomalieerkennung ein – vom gewöhnlichen Verhalten des Systems – abweichende Kommunikationsmuster. Cyberattacken können damit bspw. entlarvt werden.
  • Wie der Name schon vermuten lässt, bemüht sich die Kausalitätsermittlung um das Aufzeigen und Erklären von Zusammenhängen. Je nach technischem Ansatz wird diese Idee von den bekannten AIOps-Plattformen individuell umgesetzt.

Welche Plattformen und Tools gibt es?

AIOps-Plattformen:

  • Das Computerprogramm IBM Watson versteht natürliche Sprache und antwortet auf Fragen. Mit der Plattform Cloud Pak verfügt es zudem über eine effiziente AIOps-Lösung, um Daten aus verschiedenen Quellen zu sammeln und die daraus gewonnen Informationen an einem Punkt zu zentralisieren – eine solide und bewährte Möglichkeit der Automatisierung eines IT-Betriebs.
  • Der Anbieter Splunk konzentriert sich mit der gleichnamigen Plattform ursprünglich auf Logging, Monitoring und Reporting. Mit der zusätzlichen Sparte AIOps werden Kunden bei der Zentralisierung und der Vereinfachung der Analyse unterstützt.
  • Auch der Anbieter Aruba kombiniert Big Data und maschinelles Lernen zur Automatisierung von IT-Betriebsprozessen.

AIOps-Tools:

  • Das Marktforschungsunternehmen Gartner hat die Richtung, in die sich der IT-Sektor bewegt hat, schon früh vorausgesagt. Daraus lässt sich die Kompetenz ableiten, die sie auf diesem Gebiet aufweisen. Auf Basis von Forschungsergebnissen unterstützt Gartner Kunden, fundierte Entscheidungen zu treffen und entwickelt Tools für unterschiedlichste Unternehmensbereiche und Marktanalysen. Für den Bereich AIOps ist besonders ein Tool relevant, der Gartner Hype Cycle.