Was ist Generative Adversarial Network?

Viele Bilder, die Sie im Internet sehen, sind oftmals gefälschte computergenerierte Bilder. Im wirklichen Leben gibt es kein solches Bild von einem Hund, Schmetterling oder Pilz. Sie haben in letzter Zeit viele Beispiele dieser Art gesehen; menschliche Gesichter, Stimmen, Gemälde, Schriften usw., die von der Realität nicht zu unterscheiden sind. Die meisten dieser Studien werden mit einem künstlichen neuronalen Netz (künstliches neuronales Netz)-Modell namens Generative Adversarial Network GAN durchgeführt.

Generative Adversarial Network – die Entstehung

Die Idee zu Generative Adversarial Network GAN entstand 2014 während eines Gesprächs von Ian Goodfellow mit seinen Freunden auf einer Party und wurde anschließend als Artikel veröffentlicht. Dieser Artikel, der nach seiner Veröffentlichung populär wurde, hat in 5 Jahren mehr als 15000 Zitate erhalten, und die Anzahl der Artikel, die auf wichtigen Konferenzen in diesem Bereich veröffentlicht wurden, übersteigt 500 pro Jahr.


Wenn Sie dem Generative Adversarial Network GAN – Modell eine ausreichende Anzahl von Samples aus den zu erzeugenden Daten geben, können Sie neue Samples desselben Datentyps erzeugen lassen. Wenn Sie dem System Tausende von Vogelfotos geben, lernt das System, wie ein Vogel aussehen sollte und generiert neue Vogelfotos. Es gibt 2 verschiedene künstliche neuronale Netze, die in GANs miteinander in Konflikt stehen.

Diese werden Generator- und Diskriminatornetzwerke genannt. Das Generative Netzwerk produziert neue Daten, die wie die Realität aussehen (Bilder, Töne, Modelle usw.), während das Diskriminierungsnetzwerk versucht, zwischen gefälschten und echten Daten zu unterscheiden. Da diese beiden neuronalen Netze miteinander konkurrieren, beginnt das Diskriminierungsnetz allmählich besser zwischen echten und gefälschten Bildern zu unterscheiden.

Das generative Netzwerk erzeugt realistischere gefälschte Bilder. Wir können diesen Befehl mit einem Fälscher und einem Polizisten vergleichen. Im Laufe der Zeit wird die Polizei immer besser darin, gefälschte Münzen zu fangen, um Fälscher zu finden. Der Fälscher beginnt, realistischere gefälschte Münzen zu produzieren, um die Polizei zu schlagen.

Ist die Sicherstellung der Authentizität möglich?

Das diskriminierende Netzwerk berechnet die Wahrscheinlichkeiten, dass die empfangenen Bilder real sind, und weist ihnen einen Wert zwischen 0 und 1 zu. Ein echtes Bild sollte eine Wahrscheinlichkeit von 1 haben und ein gefälschtes Bild 0. Das Diskriminanznetz wird mit dem Verlustwert trainiert, der die Differenz zwischen den von ihm angegebenen Wahrscheinlichkeitswerten und den Werten ist, die es sein sollte.

Wenn beispielsweise das Distinctive-Netzwerk einem realen Bild den Wert 0,7 lieferte, machte es einen Fehler von 1 bis 0,7 = 0,3. Im Gegenteil, er gab einem falschen Bild einen Wert von 0,7, machte aber einen Fehler von 0,7–0 = 0,7. Die Werte des Diskriminanznetzes werden bei jeder Iteration während des Trainings aktualisiert, um diese Fehlerwerte auf 0 zu reduzieren. Im Gegenteil, das Produzentennetzwerk möchte, dass die von ihm produzierten Fake-Bilder der Wahrheit entsprechen, also mit 1 bewertet werden.

Wenn das selbsterzeugte Bild das Unterscheidungsnetz mit 0,6 bewertete, machte das erzeugende Netz einen Fehler von 1 bis 0,6 = 0,4. Das generierende Netzwerk möchte diesen Fehler auch bei jeder Iteration auf 0 reduzieren. Auf diese Weise wird das Unterscheidungsnetzwerk mit fortschreitendem Trainingsprozess erfolgreicher beim Unterscheiden zwischen echten und gefälschten Bildern. Das generative Netzwerk erzeugt realistischere gefälschte Bilder.