Text: Ule W. Ritgen • Zuletzt aktualisiert: 18.09.2024 22:50 • Lesedauer: 8,0 Min.

Neues Sprachmodell OpenAI o1: Erst denken, dann sprechen!

Wie das neue Modell komplexe Probleme löst und neue Maßstäbe setzt

Es gibt Neuigkeiten aus dem Hause OpenAI: o1 ist da! Um präzise zu sein: eine frühe Version mit Datenstand vom Oktober 2023 wurde als „Preview“ („Vorschau“) Version zahlenden ChatGPT-Nutzern zum Testen zur Verfügung gestellt.

Wer sich eine schnelle Einschätzung wünscht: Ja, bereits diese Vorschau-Version zeigt gegenüber dem aktuellen Modell ChatGPT 4o eine beeindruckende Verbesserung im Verständnis und der Analyse komplexer Probleme – also dem sogenannten „Reasoning“.

OpenAI o1: Der neue Meister im Denken!

Das Modell nimmt sich nun die Zeit und denkt sich durch viele Aspekte eines Problems, bevor es dir seine Antwort präsentiert. Wir können ab o1 also nicht mehr von „dummer KI“ sprechen, die ihre Antworten nur durch Aneinanderreihung der wahrscheinlichsten nächsten Wörter erstellt – o1 gräbt viel tiefer.

Dennoch konnten wir auch die Vorschau-Version dieses neuen Modells in unseren Tests mit überraschend alltäglichen Problemen an ihre Grenzen bringen – nicht zuletzt auch an die Grenze der aktuell pro Woche freigegebenen 50 Nachrichten, die kontinuierliches Arbeiten mit dem Modell schwierig machen.

Außerdem kann diese Version weder online recherchieren noch Bilder erzeugen. Aber die Vorschau lässt erahnen, wie gut das Modell sein wird, wenn bei Veröffentlichung der Vollversion von o1 all diese Defizite ausgemerzt sein werden.

Was ist Reasoning überhaupt?

Reasoning (deutsch: Gedankengang, Schlussfolgerung) klingt fancy, aber im Grunde bedeutet es, dass die KI Dinge Schritt für Schritt durchdenkt, bevor sie antwortet. Bis jetzt haben KI-Modelle oft einfach „aus der Hüfte geschlossen“ und Antwort ausgespuckt, ohne sich groß den Kopf zu zerbrechen. Will man vom aktuellen Modell ChatGPT-4o tiefergehende Analysen und spezifischere Antworten, dann muss man im Prompt die KI genau anleiten und sie dazu bringen, das Problem Schritt für Schritt zu bearbeten.

Das neue o1-Modell hingegen nimmt sich tatsächlich selbst die Zeit, um nachzudenken. Und das kann in vielen Bereichen extrem nützlich sein!

Worin ist o1 also besonders gut?

Ganz klar – das neue Modell ist besonders stark in Bereichen wie Mathematik, Wissenschaft und Programmierung. Du musst jetzt kein Mathegenie oder Coder sein, um davon zu profitieren. Das Coole an o1 ist, dass es wirklich komplexe Aufgaben erledigen kann – von der Lösung hochkomplizierter Matheprobleme bis hin zur Planung eines Business mit begrenztem Budget.

Die Benchmark-Tabellen, die OpenAI am 12.09. zu o1 veröffentlicht hat, zeigen: die Antworten sind nicht nur präzise, sondern auch gut durchdacht. Statt einfach nur „irgendeine“ Antwort zu geben, überlegt die KI genau, wie sie zu einer optimalen Lösung kommt und platziert sich damit u.a. unter den 500 besten Hochschul-Mathematik-Studenten der USA. Man sieht aber auch: Zwischen der gestern veröffentlichten Vorschau-Version von o1 bis zu den tatsächlichen Fähigkeiten der Vollversion von o1 ist es noch einmal ein riesiger Sprung. Wir dürfen also gespannt bleiben.

Diagramm: OpenAI o1 und o1-preview im Vergleich zu ChatGPT 4o

Wie steht es mit der Fehleranfälligkeit?

Tatsächlich konnten wir den neuen Modellen viele Mathe-Aufgaben stellen, bei denen zwar das o1-mini hin und wieder versagte, aber das große o1-Modell die Aufgaben auf den Punkt löste und dabei sehr schön auch den Lösungsweg beschrieb.

Dennoch, bei unseren Tests stießen wir mit manchen Aufgabenstellungen auch bei den neuen Modellen an die Reasoning-Grenzen, obwohl die Aufgabenstellung gar nicht so kompliziert war.

Zum Beispiel diese Aufgabe:

Ein großes Tischtuch ist 2,20 m lang und 1,30 m breit. Der Tisch, auf dem es ausgelegt werden soll, ist 1 m breit und 2 m lang. Das Schrankfach, in dem es liegen soll, ist 50 cm breit und 60 cm tief.

Wie weit hängt das Tischtuch von der Tischkante hinunter?
Wie oft muss das Tischtuch mindestens zusammengelegt werden, damit es in das Schrankfach passt?
Wie vielfach liegt es im Schrank?
Wie viele Knickfalten hat es, wenn es ausgebreitet ist?
An wie vielen Stellen kreuzen sich die Falten?

Die Fragen 1 bis 3 wurden korrekt beantwortet – auch von dem aktuellen Modell ChatGPT-4o. Aber bei den Fragen 4 und 5 schlichen sich dann Logikfehler ein. Die korrekten Lösungen sind 6 Knickfalten und 9 Kreuzungsstellen. Die Modelle – auch die neuen o1-Modelle – kamen auf andere Werte. Immerhin, während es GPT-4o und auch das neue o1-mini auch nach einer Bitte zur Überprüfung es nicht schafften, sich zu korrigieren, bemerkte das große Modell o1 den Denkfehler und konnte schließlich die Aufgabe korrekt lösen.

Fazit: Es bleibt wichtig, die Ergebnisse zu überprüfen. Aber nicht umsonst ist das Modell als „preview“ (=Vorschau) ausgezeichnet. Wobei auch das eigentlich irreführend ist, denn die Version ist weniger eine Vorschau auf o1, sondern eine frühe Version von o1 mit altem Datenbestand von 2023, die man nun veröffentlicht hat. Deshalb kann o1-preview aktuelle Entwicklungen nicht berücksichtigen. Gleichzeitig wird sicher schon einige Zeit am eigentlichen o1 weiter gearbeitet und verbessert.

Was heißt das für dich im Alltag?

Mathe und Programmierung sind für dich nicht so spannend? Keine Sorge, o1 hat auch für „normale“ Nutzer was drauf! Es geht um die Fähigkeit, komplexe Aufgaben zu durchdenken und Lösungen zu finden, die über den einfachen Alltagsgebrauch hinausgehen. Stell dir vor, du erstellst einen Businessplan oder suchst eine clevere Lösung für ein Problem – o1 denkt für dich voraus, kalkuliert und prüft alle Optionen.

Selbst wenn du kein Tech-Profi bist, könnte es dir gefallen, dass o1 Probleme wie ein echter Denker löst, statt einfach nur schnell eine Antwort hinzuschmeißen. Ob es um finanzielle Entscheidungen oder Marketingpläne geht – o1 analysiert und bietet dir fundierte Entscheidungen.

Sobald die Einschränkungen der Vorschau-Version wegfallen, wird das ein echter Gamechanger.

Wie ändert sich das Prompting?

Hier wird’s spannend! Das neue o1-Modell funktioniert anders als die bisherigen KI-Versionen. Früher hat man versucht, die KI möglichst detailliert zu instruieren: „Schritt für Schritt“, „mach dies“, „berücksichtige jenes“. Jetzt heißt es: zielorientiert und präzise.

Was bedeutet das? Statt lange Prompts zu verwenden, die jeden kleinen Aspekt detailliert erklären, kannst du einfach klare Ziele formulieren. Dabei musst du natürlich weiterhin sehr spezifisch den Kontext beschreiben, dann aber der KI die Freiheit geben, selbst zu überlegen, wie sie die Aufgabe löst. Hier ein Vergleich:

Herkömmlicher Best Practice Prompt:

Der Businessplan sollte die folgenden Punkte detailliert abdecken:

Erstelle einen Businessplan für ein nachhaltiges T-Shirt-Unternehmen mit einem Budget von 20.000 Euro. Der Plan sollte auf Nachhaltigkeit fokussieren. Gehe dabei Schritt für Schritt vor und erstelle:

Eine tiefgehende Marktanalyse mit Trends, Marktwachstum und potenziellen Herausforderungen.
Eine detaillierte Zielgruppenanalyse mit demografischen Merkmalen, Verhaltensweisen und Bedürfnissen.
Eine Wettbewerbsanalyse mit Hauptwettbewerbern, ihrer Marktposition und ihren Alleinstellungsmerkmalen.
Finanzplanung mit Umsatzprognosen, erwarteten Kosten und einer Gewinn- und Verlustrechnung.
Marketingstrategie, die Online- und Offline-Kanäle umfasst, sowie Social-Media-Plattformen für den Verkauf im Jahr 2024.
Ein Zeitplan mit Meilensteinen für die nächsten sechs Monate.
Aktuelle Daten und Quellen zur Untermauerung des Plans.

Zielorientierter Prompt für o1 (Best Practice für das neue Modell):

„Erstelle einen Businessplan für ein nachhaltiges T-Shirt-Unternehmen mit einem Budget von 20.000 Euro. Der Plan sollte auf Nachhaltigkeit fokussieren und Strategien enthalten, um in den ersten sechs Monaten profitabel zu werden. Berücksichtige dabei aktuelle Markttrends und empfehle die besten Marketingkanäle. Nutze Daten, um die Analyse zu untermauern.“

In diesem Fall weiß das Modell, dass es Marktanalysen, Finanzplanung und Marketingstrategien braucht. Es kann seine Fähigkeit zum mehrstufigen Denken voll ausspielen und tiefergehende Lösungen entwickeln, ohne dass du ihm jeden Schritt vorkauen musst. Das spart nicht nur Zeit, sondern liefert auch bessere, durchdachtere Antworten.

Aber genau in diesem Punkt müssen wir noch abwarten, bis das richtige o1 zur Verfügung steht und uns dann die Ergebnisse ansehen.

o1 als Preview und Beschränkungen für Plus-Nutzer

Aktuell gibt es o1 nur als Preview-Version für ChatGPT-Plus-Nutzer. Das bedeutet, wenn du das Modell ausprobieren willst, brauchst du ein Abo. Es gibt dabei aber eine wichtige Einschränkung: Nur 50 Nachrichten pro Woche dürfen mit o1 gesendet werden. Das mag nach viel klingen, aber wenn du an komplexen Projekten arbeitest, musst du gut damit haushalten und die Nachrichten sinnvoll einsetzen.

Für Nutzer, die regelmäßig tiefere Analysen oder komplexere Aufgaben bearbeiten, könnte das eine Herausforderung sein – also besser gut planen und präzise Prompts nutzen, um das Maximum aus den 50 Nachrichten herauszuholen.

Und was ist mit o1 Mini?

Neben dem großen Bruder gibt es auch eine Mini-Version von o1. Diese ist etwas „leichter“ und erlaubt bis zu 50 Nachrichten pro Tag. Sie ist besonders dann nützlich, wenn du kleinere, weniger rechenintensive Aufgaben hast, aber trotzdem die Denkprozesse und Reasoning-Fähigkeiten von o1 nutzen möchtest.

Für Nutzer, die keine extrem komplexen Aufgaben bewältigen müssen, aber dennoch von besseren Ergebnissen profitieren wollen, ist o1 Mini ideal. Es verarbeitet Aufgaben schneller und effizienter und ist daher gut geeignet für Dinge wie:

Kleinere Finanzanalysen
Programmieraufgaben
Kurze Geschäftspläne oder Strategien
Alltägliche Entscheidungsfindung

Warum dauert es manchmal länger?

Manche Benutzer werden vielleicht bemerken, dass das Modell etwas länger braucht, um eine Antwort zu generieren. Das liegt daran, dass o1 eben nicht „mal eben“ antwortet, sondern sich die Zeit nimmt, die Schritte zu durchdenken. Stell dir vor, du fragst nach einem Businessplan – o1 arbeitet wie ein echter Berater: Es analysiert, kalkuliert und präsentiert dir erst dann eine durchdachte Lösung.

Und was bringt dir das konkret?

Das neue Modell bringt eine höhere Präzision in allen Bereichen, in denen es ums Nachdenken geht. Du kannst es für mathematische Berechnungen nutzen, aber auch für wissenschaftliche Aufgaben oder wenn du einfach mal eine fundierte Entscheidung brauchst. Es geht nicht nur um schnelles gutklingelndes Bla-Bla, sondern um echte Denkarbeit. Die KI macht Vorschläge, die du wirklich umsetzen kannst – und das, ohne selbst groß den Kopf rauchen zu lassen.

Quelle: OpenAI

Highlights