Was ist GPT-4?
Unter GPT-4 versteht man ein fortschrittliches Sprachmodell, welches die Technologie von Natural Language Processing (NLP) Modellen nutzt und vom Unternehmen OpenAI entwickelt wurde. GPT steht für „Generative Pre-trained Transformer“ und stellt dabei die vierte Generation der Sprachmodelle von OpenAI dar. Wie bei seinem Vorgänger GPT-3.5 können Texteingaben über ChatGPT abgewickelt werden. Zusätzlich kann eine Schnittstelle über eine API (Application Programming Interface) eingerichtet werden.
Leistung und Fähigkeiten
Der Leistungsumfang des Sprachmodells bezieht sich vor allem auf die Verarbeitung und Ausgabe von Nutzeranfragen in Form von menschlicher Sprache. Zur Bewerkstelligung dieser Funktion wurde GPT-4 mit Trainingsdaten trainiert und anschließend durch menschliches Feedback optimiert. Auf Basis dieses Trainingsmodells soll GPT-4 menschenähnliche Texte ausgeben und komplexe Problemstellung auf Grundlage der Eingabe durch den Nutzer lösen können. Durchgeführte Tests gaben gezeigt, dass GPT-4 in der Lage ist, Aufnahmeprüfungen für Universitäten oder andere Tests positiv zu absolvieren.
Die Trainingsdaten basieren zum aktuellen Zeitpunkt auf einem Stand vom September 2021, weshalb Ereignisse und Erkenntnisse, welche nach diesem Zeitpunkt auftreten, vom Modell mitunter nicht gewusst oder ausgegeben werden. Wie seine Vorgänger ist auch GPT-4 mit Einschränkungen auf dem Gebiet der Zuverlässigkeit konfrontiert. Nach wie vor ist es laut einer Unternehmensangabe möglich, dass GPT-4 Fakten „halluziniert“, also falsche Aussagen ausgibt, wobei die Ergebnisse der Faktizität aufgrund eines speziellen Nachtrainings geringfügig besser ausfällt als unter GPT-3.5.
Trainingsdaten und Training des Modells
Die Trainingsdaten des Sprachmodells wurden sowohl aus öffentlich verfügbaren Daten wie Internetdaten als auch durch das Unternehmen lizenzierte Daten erstellt. Dahin gehend befinden sich in den Trainingsdaten sowohl korrekte als auch falsche Antworten, starke als auch schwache Argumentationen sowie widersprüchliche als auch konsistente Aussagen. Ferner ist eine große Vielfalt an Ideologien und Ideen in den Daten enthalten. Zur Optimierung der Ausgabequalität wurde das Verhalten des Modells mithilfe von „Reinforcement Learning from Human Feedback (RLHF)“ optimiert. Bei diesem Prozess werden die Trainingsdaten zur Verfügung gestellt, durch überwachtes Lernen (supervised learning) gelernt und anschließend durch bestärkendes Lernen (reinforcement learning) mittels Belohnungsmodellen verbessert.
Unterschiede von GPT-4 zu GPT-3
Laut Aussagen seitens OpenAI werden Neuerungen gegenüber GPT-3 bzw. GPT-3.5 nicht bei einer einfachen Unterhaltung in der Ausgabe ersichtlich, sondern erst, wenn ein bestimmter Schwellenwert in der Komplexität der Aufgabe überschritten wird. Demnach soll GPT-4 in der Lage sein, zuverlässiger und kreativer zu antworten und Anweisungen nuancierter zu verarbeiten. Die neue Version zeigt zudem eine Verbesserung in der Ausgabequalität von unterschiedlichen Sprachen, einschließlich sogenannter ressourcenarmer Sprachen.
Entwicklungen zeigen sich auch auf dem Gebiet der Lenkbarkeit des Sprachmodells, indem GPT-4 in der Lage ist, den Stil und die Ausführlichkeit sowie die Tonalität der Ausgabe innerhalb von bestimmten Grenzen anzupassen. Zudem sollte es laut Unternehmensangaben schwieriger sein, „schlechtes Verhalten“ durch das Modell hervorzurufen und somit sogenannte Jailbreaks zu erzeugen, indem Inhalte generiert werden, welche gegen die Nutzungsinhalte des Unternehmens verstoßen. GPT-4 wird als multimodales Sprachmodell gesehen und ist in der Lage, sowohl Bild- als auch Texteingaben zu akzeptieren und zu verarbeiten und Textausgaben zurückzumelden.
GPT-4 Anwendungsbeispiele
Die Anwendungsfälle von GPT-4 sind sehr vielseitig und branchenübergreifend einsetzbar. Beispielsweise lässt sich das Sprachmodell auf dem Gebiet des Kundenservice einsetzen, um dort die Kommunikation mit Kundenanfragen in Form eines Chatbots zu übernehmen. Aufgrund der Variabilität der Tonalität der Ausgabe lässt sich die Konversation gewissermaßen anpassen. Einen weiteren Anwendungsfall beschreibt die Nutzung in der Unterhaltungsbranche. Mit GPT-4 können etwa Drehbücher, Texte oder Gedichte erstellt werden. Anwendungstests haben gezeigt, dass GPT-4 auch Humor verstehen kann, welches die Einsatzmöglichkeiten in der Unterhaltungsbranche nochmals erweitert.
Wie bereits seine Vorgänger ist auch GPT-4 in der Lage zu programmieren. Aufgrund der Fähigkeit der Bildeingabe des Sprachmodells können nun anhand von importierten Skizzen Webseiten erstellt und programmiert werden. Die Möglichkeit der Bildeingabe eröffnet zum Beispiel auch Anwendungsfälle im Bereich der Medizin, indem bei bildgebenden Untersuchungsverfahren Auffälligkeiten erkannt, kategorisiert und angezeigt werden können. Aufgrund des multimodalen Aufbaus und der variablen Einsatzbereiche von GPT-4 besteht Potenzial für die Anwendung und Verknüpfung des Sprachmodells über mehrere Branchen hinweg.
Wie kann ich GPT-4 nutzen?
GPT-4 soll über eine kostenpflichtige Lizenzversion im Rahmen des ChatGPT Plus Abomodells unter chat.openai.com mit einer Nutzungsobergrenze zur Verfügung stehen. Das Unternehmen gibt an, dass sich diese Nutzungsobergrenze am Bedarf und der Systemleistung in der Praxis orientieren wird und variabel ist. Zudem könnten neue Abonnementstufen eingeführt bzw. für Testzwecke eine bestimmte Anzahl kostenlose GPT-4-Abfragen zur Verfügung stehen. Eine weitere Zugriffsmöglichkeit besteht über eine API-Schnittstelle, über welche die Funktionalität von GPT-4 auf externen Anwendungen umgesetzt werden kann.