Bedrohen Chatbots den Wettbewerb?
Die EU will den Markt für künstliche Intelligenz regulieren. Roboter mit Kapuzenpullover. (Bild: Keystone)
Die jüngsten Entwicklungen im Bereich der generativen künstlichen Intelligenz (KI) – also KI, die eigene Inhalte erzeugt (siehe Begriffserklärungen im Kasten) – bieten ungeahnte Möglichkeiten betreffend Digitalisierung und Automatisierung von Alltagsprozessen. Sie lösen aber auch Ängste aus. Bereits wird von verschiedenen Seiten ein Moratorium der KI-Entwicklung gefordert aus Sorge, dass künstliche Intelligenz entsteht, die der Mensch nicht mehr versteht und die sich nicht kontrollieren lässt. Weniger Beachtung findet hingegen das Wettrennen der grossen Internetkonzerne um die Vorherrschaft im KI-Markt. Die Gewinner werden unseren Lebensalltag voraussichtlich entscheidend mitgestalten.
Marktmächtige Anbieter von Basismodellen
ChatGPT ist ein vom US-amerikanischen Unternehmen OpenAI entwickelter Chatbot, der menschliche Anfragen in natürlicher Sprache (sog. Prompts) interpretiert und mithilfe von KI beantwortet. Dem Chatbot liegt das Sprachmodell GPT zugrunde, ein mit grossen Textmengen trainiertes Basismodell (oder Foundation Model), das als Grundlage für verschiedenste Anwendungen genutzt werden kann. Microsoft arbeitet etwa zurzeit daran, GPT in sein Office-Paket zu integrieren. So können mit Prompts in natürlicher Sprache automatisch Dokumente und Präsentationen erstellt oder Daten analysiert werden.[1] Duolingo, ein Onlinedienst zum Erlernen von Fremdsprachen, verwendet GPT hingegen, um Konversationen in einer Fremdsprache zu simulieren.
Das Erstellen eines konkurrenzfähigen Basismodells ist nicht jedem möglich. Zum einen werden dazu umfassende Datensätze benötigt, die nur wenigen zur Verfügung stehen – etwa Microsoft und Google: Sie betreiben als einzige westliche Unternehmen systematisches «Web Scraping», das heisst, sie extrahieren und speichern die Informationen, die auf Websites angezeigt werden. Zum anderen benötigt das Trainieren eines Basismodells riesige Rechenleistungen, und diese existieren vor allem in den Cloudservices von Microsoft Azure, Google Cloud und Amazon Webservices.
Hier zeigt sich eine klare Parallele zu anderen digitalen Märkten, etwa Betriebssystemen: Die Entwicklung beziehungsweise der Betrieb eines Basismodells ist durch starke Skalen- und Netzwerkeffekte gekennzeichnet. Es ist deshalb damit zu rechnen, dass sich nur einige wenige Anbieter auf dem Markt werden etablieren können. Die meisten Unternehmen werden hingegen Basismodelle auf Basis von Lizenzen nutzen und für ihre jeweiligen Anwendungen adaptieren.
Der Wert von Daten
Gelten Daten schon seit Längerem als das Gold des 21. Jahrhunderts, gewinnen diese im Zusammenhang mit generativer KI nochmals an Bedeutung. Wer bereits über umfassende Datensätze verfügt, um ein Basismodell zu füttern, hat nicht nur aus diesem Grund einen Vorteil: Weil Nutzeranfragen Teil des Datensatzes werden, tragen diese laufend zur Verbesserung des Modells bei. Die Weiterentwicklung von KI dank menschlichen Feedbacks war ein zentraler Schritt in der Entwicklung von GPT. Vereinfacht gesagt, lernt das KI-Modell hierbei aus den Bewertungen seiner Antworten durch reale Menschen.
Ein Blick in die jüngere Vergangenheit zeigt, wie entscheidend der Datenzugang für den Wettbewerb sein kann. Im Juni 2022 ging die Software Dall-E von OpenAI online. Ausgehend von einer Benutzereingabe, generiert sie realistische Bilder. Zwei Monate später kam das konkurrierende Open-Source-Programm Stable Diffusion auf den Markt. Es funktioniert ähnlich beziehungsweise generiert ebenso Bilder wie Dall-E. Möglich war die Entwicklung von Stable Diffusion nur, weil die Programmierer kostenlosen Zugriff auf umfangreiche Bild-Datensätze hatten, um ihr Modell zu trainieren und zur Marktreife zu bringen.[2] Daten stellen bei der Entwicklung von generativer KI in diesem Sinne eine Art «Essential Facility» dar, also eine Infrastruktur, deren Nutzung zur Erbringung einer Dienstleistung unerlässlich ist: Ohne den Zugang zu geeigneten Daten zu angemessenen Bedingungen ist ein Markteintritt de facto nicht möglich. Nur dank des Zugangs zu (kostenlosen) Bilddaten existieren nun mehrere konkurrierende KI-Anwendungen zum Erstellen von Bildern.
Plattformen mit starken Netzwerkeffekten
OpenAI ist es nicht nur gelungen, ein Basismodell, das am Anfang der Wertschöpfungskette steht, zu entwickeln. Mittels ChatGPT wird gleichzeitig ein Produkt für die Endnutzer bereitgestellt. Aktuell gibt es bereits 12 Plug-ins für ChatGPT, die es ermöglichen, auf andere Dienstleistungen zuzugreifen. So lassen sich etwa via ChatGPT Reisepläne auf der Buchungsplattform Expedia erstellen. Chatbots wie ChatGPT weisen somit Ähnlichkeiten mit einem App-Store auf: Einzelne Plug-ins werden wie Apps verwendet, der Zugang erfolgt aber immer über den entsprechenden Chatbot. Dies bewirkt starke Netzwerkeffekte: Je mehr Plug-ins existieren, desto attraktiver wird es, Dienstleistungen über eine einzelne Schnittstelle (z. B. ChatGPT) abzurufen und anzubieten. Und die verstärkte Nutzung des immer gleichen Chatbots füttert diesen wiederum mit zusätzlichen Daten, sodass der Algorithmus immer besser wird.[3]
Neue Spielregeln für die grossen Tech-Unternehmen
Die Erfahrungen mit den grossen Tech-Unternehmen haben gezeigt, dass das Wettbewerbsrecht in digitalen Märkten unter Umständen nicht ausreicht, um den Wettbewerb effektiv zu schützen. Die Tendenz zu wenigen, den Markt dominierenden Unternehmen ist stark. Die Entwicklungen sind teilweise so schnell, dass Entscheide in Kartellrechtsfällen oft viel zu spät kommen. Die EU hat hierauf reagiert und mit dem Digital Services Act (DSA) und dem Digital Markets Act (DMA) Spielregeln für digitale Märkte festgelegt. Diese beinhalten unter anderem weitreichende Anforderungen an die Transparenz und Verhaltensauflagen für grosse Tech-Unternehmen. Im Bereich der KI berät die EU zudem aktuell über den AI Act und den Data Act, wobei insbesondere letzterer Entwurf weitreichende Datenteilungspflichten für Unternehmen vorsieht.
In der Schweiz fehlen entsprechende Regeln zurzeit gänzlich. Zwar soll vom Eidgenössischen Departement für Umwelt, Verkehr, Energie und Kommunikation (Uvek) bis im März 2024 eine Vorlage zur Regulierung von grossen Kommunikationsplattformen ausgearbeitet werden. Was diese im Detail beinhalten wird, ist zurzeit noch unklar – erste Äusserungen des Uvek deuten jedoch darauf hin, dass keine wettbewerblichen Spielregeln für grosse Tech-Unternehmen vorgesehen sind. Ob eine ausgeklügelte Regulierung, wie sie in der EU zurzeit umgesetzt wird, der Weisheit letzter Schluss ist, mag umstritten sein. Klar ist aber, dass Daten in einer Welt generativer KI immer mehr die Rolle einer «Essential Facility» zukommt. Zu empfehlen wäre deshalb, die Frage nach dem Zugang zu Daten auch in der Schweiz nicht gänzlich ausser Acht zu lassen.
- Microsoft hält 49% der Anteile an OpenAI und stellte die nötigen Rechenleistungen seiner Azure Cloud für das Training von GPT kostenlos zur Verfügung. []
- Diese wurden von der Non-Profit-Organistion Large-scale Artificial Intelligence Open Network (LAION) mittels «Web Scraping» erhoben und gratis veröffentlicht. []
- Seit April 2023 können Nutzer sich entscheiden, ob ihre Konversationen mit ChatGPT für das weitere Training des Chatbots zur Verfügung stehen. []
Zitiervorschlag: Eschenbaum, Nicolas; Funk, Michael; Rutz, Samuel (2023). Bedrohen Chatbots den Wettbewerb? Die Volkswirtschaft, 11. Juli.
Basismodell oder Foundation-Modell: ein bereits vortrainiertes KI-Modell, das als Ausgangspunkt für die Entwicklung spezifischerer KI-Modelle dient. Es wird in der Regel mit extrem grossen Datenmengen trainiert, sodass es für viele verschiedene Anwendungen gebraucht werden kann.
GPT: steht für «Generative Pre-trained Transformer»; es handelt sich um eine neuronale Netzwerkarchitektur, die von OpenAI für die Verarbeitung natürlicher Sprache wie Texterzeugung, Übersetzung und Zusammenfassung entwickelt wurde. Die aktuell neueste Version von GPT ist GPT-4.
ChatGPT: ein von OpenAI entwickeltes Sprachmodell, das auf der GPT-Architektur basiert. ChatGPT wurde entwickelt, um menschenähnliche Antworten auf Aufforderungen in natürlicher Sprache («Prompts») zu generieren.
Generative KI: eine spezifische Kategorie der künstlichen Intelligenz, bei der KI neue Daten (z. B. Bilder, Musik oder Text) erzeugt, anstatt nur gespeicherte Daten wiederzugeben.
Finetuning: ein Prozess, bei dem ein Basismodell verwendet wird und seine Parameter mit einem kleineren, domänenspezifischen Datensatz trainiert werden. Damit soll das Basismodell verfeinert und auf eine spezifische Aufgabe spezialisiert werden.