Die Volkswirtschaft

Plattform für Wirtschaftspolitik

Dieser Artikel ist Teil des Schwerpunkts «Konjunktur: Der Blick in die Kristallkugel»

Wie Google-Suchen wirtschaftliche Entwicklungen voraussagen

Aussagen wirtschaftlicher Entscheidungsträger und Anfragen bei Suchmaschinen geben Hinweise auf Tendenzen und auf die gesellschaftliche Stimmungslage. Mithilfe dieser neuen Daten lassen sich genauere Konjunkturprognosen erstellen.

Die Websuche spiegelt gesellschaftliche Trends: Wenn übermässig viele Menschen den Begriff «Grippe» googeln, deutet dies auf eine Epidemie hin. (Bild: iStock)

Abstract lesen...

Ökonomen stehen immer mehr Daten zur Verfügung. Seit 2006 kann etwa auf die Daten von Google-Suchergebnissen zugegriffen werden. Und auch die Zentralbanken halten ihre Erklärungen und Entscheidungen schriftlich fest. Um alle diese Informationen zu analysieren, wurden verschiedene Tools entwickelt. Sie dienen insbesondere dazu, Echtzeit-Prognosen zu erstellen oder die Rolle der Medien bei der Preisbildung von Finanzanlagen zu untersuchen. Für Ökonomen, die Prognosen zu BIP und Arbeitslosigkeit erstellen, sind diese neuen Techniken ein Glücksfall. Doch angesichts der immer unterschiedlicheren Daten ist es nicht einfach, diese Verfahren zu beherrschen.

Ungewissheit, Angst und Misstrauen: Gefühle dieser Art wirken sich ungünstig auf die Wirtschaft aus, da mit ihnen die Investitionen und der Konsum zurückgehen und die Arbeitslosigkeit zunimmt. Zwar werden solche Stimmungsvariablen erst seit Kurzem gemessen, aber immer mehr Ökonometriker befassen sich damit, um ökonomische Theorien zu unterstützen. Dank des Zugriffs auf grosse Datenmengen und auf leistungsfähigere IT-Ressourcen konnten so neue Forschungsansätze entwickelt werden. Ein Beispiel: Im Finanzsektor etwa werden Finanznachrichten und Texte aus sozialen Netzwerken über ein Unternehmen analysiert, um Schwankungen der Preise von Vermögenswerten zu prognostizieren und zu untersuchen, wie sich neue Informationen auf die Preisentwicklung auswirken. Auch in der Makroökonomie werden Textanalysen verwendet, um Veränderungen der Inflation und der Arbeitslosigkeit vorherzusagen und die Auswirkungen politischer Ungewissheit abzuschätzen.

Gefühle und Stimmungen sind in den Wirtschaftswissenschaften etwas anders definiert. So dient beispielsweise an den Finanzmärkten die Volatilität als Massstab für Ungewissheit. Diese Ungewissheit entsteht durch wirtschaftspolitische Entscheide, die im Anschluss an Erklärungen und Massnahmen von Zentralbankverantwortlichen getroffen werden.[1] Solche nicht direkt beobachtbaren Grössen bezeichnet man als «latente Variablen». Die Volatilität von finanziellen Renditen gehört zu den bekanntesten latenten Variablen in der Wirtschaft und kann mithilfe von Zeitreihen modellhaft dargestellt werden. Um sie zu messen, benötigt man eine sogenannte Proxy-Variable. Denn eine Rendite wird zwar täglich verzeichnet, aber nicht ihre inhärente Volatilität. Und um diese zu ermitteln, können mehrere Proxy-Variablen hilfreich sein: etwa das Quadrat der Renditen oder ein statistisches Modell, aus dem sich diese latente Variable ergibt.

Das Internet spiegelt unsere Sorgen

Ökonomen verwenden in der Regel quantitative Variablen. Doch die Wirtschaftswissenschaft ist eine Sozialwissenschaft und als solche auch an qualitativen Variablen interessiert. In der Vergangenheit wurden in erster Linie Fragebögen verwendet, um diese Variablen zu quantifizieren. Auch der «Consumer Sentiment Index» der Universität Michigan wird so ermittelt. Mittels dieser telefonischen Umfrage werden jeden Monat die qualitativen Antworten von rund 500 Haushalten untersucht. Gefragt wird dabei nach ihrer jeweiligen finanziellen Lage, nach den in einem Jahr erwarteten finanziellen Bedingungen oder nach den erwarteten allgemeinen wirtschaftlichen Bedingungen in den nächsten zwölf Monaten. Der dadurch erhobene Konsumentenstimmungsindex zum US-Konsumentenvertrauen entspricht dann dem Durchschnitt der Antworten.

Seit einigen Jahren wird jedoch zunehmend auch die inhärente «Stimmung» von Textdaten analysiert. Solche Textdaten sind durch die Digitalisierung der Kommunikationsträger in grossen Mengen verfügbar geworden. So hat sich ein neuer Bereich der ökonometrischen Forschung entwickelt, der untersucht, wie grosse Mengen qualitativer Daten, die solche Stimmungshinweise enthalten, am besten in quantitative Variablen umgewandelt werden.[2] Die dadurch entwickelten Methoden ermöglichen es beispielsweise, in Erklärungen von Zentralbankchefs oder in Artikeln von Fachzeitschriften über Geldpolitik Trends besser zu erkennen. Das dabei berücksichtigte Textvolumen kann von nur 20 Dokumenten bis zu Tausenden von Artikeln reichen.

In der Ökonometrie gibt es zahlreiche Ansätze, wie man solche Textdaten verwenden kann.[3] Mithilfe linguistischer Tools, wie etwa der automatischen Verarbeitung natürlicher Sprache, werden die qualitativen Daten in Zahlen umgewandelt. Mit anderen Worten: Die «Gefühle» werden quantifiziert. Dafür gibt es zwei Möglichkeiten: entweder mittels Algorithmen für maschinelles Lernen oder mit Methoden, die auf dem Wortschatz beruhen. Das Ergebnis hängt jedoch nach wie vor weitgehend von der Wahl der Methode ab. Je nach Zweck muss man deshalb sorgfältig prüfen, welche die passende Methode ist.

Auch Umfragen oder Proxy-Variablen[4] können verwendet werden. Ein Beispiel dafür sind Daten von Internet-Suchanfragen, die auf der Website Google Trends aufgeführt sind. Gerade Daten von Google Trends sind im Gegensatz zu teuren und schwer reproduzierbaren Erhebungen öffentlich verfügbar. Auch wenn jede Google-Suche aus einem bestimmten Grund durchgeführt wurde, können mithilfe von vielen aggregierten Suchdaten interessante Forschungsfragen beantwortet werden. Denn aus den Suchanfragen der Internetnutzer lassen sich Schlussfolgerungen zu den Interessen, Bedenken oder Absichten der Öffentlichkeit ziehen.

Der Effekt negativer Kommunikation

Mit der Quantifizierung von Suchdaten über Google Trends und von Textdaten, die zur Messung latenter Stimmungsvariablen dienen, lassen sich die Prognosen in vielen Wirtschaftsbereichen verbessern. So etwa Vorhersagen darüber, wie sich die Kommunikation von Zentralbanken auf die Finanzmärkte auswirkt. Eine Studie[5] nutzte etwa die Mitteilungen des Offenmarktausschusses der US-amerikanischen Notenbank (FOMC), um Schwankungen bei den US-Staatsanleihen zu prognostizieren. Es stellte sich heraus, dass inhaltliche Änderungen der Aussagen in den Berichten des FOMC der Hauptfaktor für Veränderungen der Zinssätze sind – mehr noch als unerwartete Abweichungen vom Leitzins.

Eine andere Studie[6] erweiterte diese Idee und untersuchte den Einfluss, den die kommunizierte Stimmung in den Mitteilungen der Zentralbanken auf die Renditen und die Volatilität der Finanzmärkte hatte. Mittels Berichten über die Finanzstabilität und Erklärungen der Zentralbankpräsidenten wurde ein Stimmungsindex für Finanzstabilität entwickelt. Dabei zeigte sich, dass optimistische Berichte im darauffolgenden Monat tendenziell höhere Aktienkurse und eine tiefere Marktvolatilität zur Folge hatten.

Die Analyse verfügbarer Daten aus dem Internet erlaubt auch bessere Prognosen zu den Preisen von Vermögenswerten. Mittels spezieller Wörterbücher, die Textdateien auf optimistische und pessimistische Begriffe absuchen, konnte beispielsweise gezeigt werden, dass bei pessimistischen Presseartikeln negative Renditen prognostiziert wurden. Dieser Effekt ist allerdings nur vorübergehend, denn Presseartikel liefern keine grundlegenden Informationen und ihre Wirkung auf die Preise gleicht sich nach einigen Tagen wieder aus. Insgesamt eignet sich für die Prognose von Aktienkursen maschinelles Lernen besser als wörterbuchbasierte Indizes.[7]

Echtzeit-Schätzungen werden möglich

Wichtige Kennzahlen wie die Arbeitslosigkeit und das Bruttoinlandprodukt (BIP) werden nicht sehr häufig gemessen. Und die betreffenden Schätzungen werden erst mit erheblicher Verzögerung veröffentlicht. In Frankreich publiziert das Nationale Institut für Statistik und Wirtschaftsstudien (Insee) beispielsweise den monatlich ermittelten Konsumentenpreisindex innerhalb eines Monats. Andere Variablen, wie rassistische Vorurteile oder die Korruption lokaler Behörden, werden bei den Standardmessungen überhaupt nicht berücksichtigt. Online produzierte Texte wie Google-Suchen, Veröffentlichungen in sozialen Netzwerken, Listen auf Job-Websites usw. können helfen, alternative Echtzeit-Schätzungen dieser Variablen zu erhalten. Im Gegensatz zu standardmässigen Prognosen werden mehrere Datenquellen verwendet, um die aktuellen Werte zu schätzen.

Ein herausragendes Beispiel dafür ist das Projekt «Google Flu Trends». Anhand der Internetsuchanfragen prognostiziert es den Verlauf einer Grippewelle. Im Gesundheitssektor können viele Suchanfragen zu einer Krankheit ein aussagekräftiger Prädiktor für ihre Ausbreitung sein.[8] Im Wirtschaftsbereich werden Internet-Suchanfragen hingegen hauptsächlich zur Vorhersage der Arbeitslosenquote verwendet, und zwar anhand von Suchbegriffen, die im Zusammenhang mit der Stellensuche stehen. Die Daten von Google Trends können für die unverzügliche Prognose sozioökonomischer Variablen genutzt werden.[9] Bestimmte Google-Suchkategorien eignen sich auch für Prognosen zu Auto- und Hausverkäufen sowie zur touristischen Nachfrage und zur Arbeitslosigkeit. Ausserdem können Suchanfragen erklären, welche Rolle die Korruption in einem Land spielt. In Russland beispielsweise dient die Anzahl der Suchanfragen mit dem Stichwort «Nawalny» dazu, Verbesserungen bei der Führung korrupter Unternehmen zu beschreiben.[10] Alexei Nawalny ist ein Mitglied der russischen Oppositionspartei Jabloko und Autor eines Blogs über Korruption.

Die neuen Techniken sind ein Segen für Ökonomen, die Prognosen zu bestimmten Wirtschaftsaggregaten erarbeiten. Doch grosse Möglichkeiten bedeuten auch grosse Verantwortung. Es ist nicht einfach, diese Tools im immer dichteren Datendschungel zu beherrschen. Denn eine individuelle Google-Suche wird möglicherweise von einer Person durchgeführt, die nur die korrekte Schreibweise des Begriffs «Arbeitslosigkeit» nachprüfen möchte, oder von einem Medizinstudenten, der sein Wissen über die Grippe testen möchte.

  1. Baker et al. (2016). []
  2. Für weitere Einzelheiten siehe Algaba et al. (2019). []
  3. Für eine detaillierte Übersicht siehe insbesondere Gentzkow et al. (2018). []
  4. Überprüfbare Variable, die eine nicht überprüfbare oder nicht messbare Variable ersetzt. []
  5. Lucca und Trebbi (2009). []
  6. Baker et al. (2014). []
  7. Jegadeesh und Wu (2013). []
  8. Siehe insbesondere Zeng und Wagner (2002). []
  9. Choi und Varian (2012). []
  10. Enikolopov et al (2018). []

Dozent für Ökonometrie, Forschungszentrum für Wirtschaftsstrategien (Crese), Universität Franche-Comté, Besançon (Frankreich)

Literatur

Dozent für Ökonometrie, Forschungszentrum für Wirtschaftsstrategien (Crese), Universität Franche-Comté, Besançon (Frankreich)