Rechercher

Prédire l’avenir grâce aux données des moteurs de recherche

Lorsque l’on recherche des informations, on se rend sur Google. Les requêtes saisies dans le moteur de recherche génèrent des données qui permettent de prédire l’avenir.

Prédire l’avenir grâce aux données des moteurs de recherche

La fréquence des recherches effectuées sur Internet, au sujet d’un événement sportif par exemple, témoigne de l’intérêt porté à celui-ci. Une participante au marathon de la Jungfrau, à la Kleine Scheidegg, dans le canton de Berne. (Image: Keystone)

Les scientifiques s’intéressent depuis bien longtemps à l’anticipation des tendances futures. Dans ce domaine, Internet constitue une précieuse source de données. Grâce à des méthodes scientifiques éprouvées, les données en temps réel qui s’accumulent sur la toile au gré des recherches effectuées par les utilisateurs peuvent être analysées et interprétées afin que des enseignements soient tirés sur le passé, le présent et l’avenir[1].

Les achats en ligne, par exemple, sont souvent précédés de recherches sur Internet qui permettent d’identifier les futurs comportements d’achat potentiels. De même, en cas de problème de santé, les gens s’informent d’abord sur Internet sur leurs symptômes et les remèdes susceptibles de les soulager. Si de nombreuses personnes recherchent des informations médicales similaires, on peut par exemple en déduire qu’un vaste groupe de population souffre d’une maladie donnée comme la grippe par exemple. La fréquence des termes de recherche permet également de mesurer l’intérêt des gens pour des valeurs boursières, des événements sportifs, des destinations de vacances, etc.

D’une manière générale, ces données permettent donc de savoir ce qui intéresse la population à un moment donné, ce qui la préoccupe ou ce qu’elle a l’intention de faire. Ces informations suscitent l’intérêt non seulement des scientifiques, mais aussi des entreprises et des institutions les plus diverses (médias, instituts de conjoncture, banques, entreprises de marketing ou agences de sécurité).

Google Trends, une source de données privilégiée

Depuis janvier 2004, Google met gratuitement à la disposition de toutes les personnes intéressées des séries temporelles sur les requêtes de recherche, sous forme anonymisée, et en temps réel[2]. Il est possible de les consulter par région ou par période. En fonction de la durée de la période sélectionnée, les données sont normalisées et disponibles sur une base quotidienne, hebdomadaire ou mensuelle. Elles sont présentées sous la forme d’indices les valeurs étant comprises entre 0 et 100[3].

À des fins d’illustration, le terme de recherche «cadeau» a été saisi en trois langues dans Google Trends (voir illustration). Si le nombre de requêtes sur ce terme augmente fortement chaque année à l’approche des fêtes de Noël, on constate que c’est également le cas, comme on pouvait s’y attendre, en février avant la Saint-Valentin et en mai avant la fête des mères.

Avant Noël, le terme «cadeau» est très fréquemment recherché sur Google en Suisse

GRAPHIQUE INTERACTF
Source: Google Trends / La Vie économique

Un recours intensif à Google Trends

Contrairement aux données issues des enquêtes classiques, les données en temps réel fournies par Google Trends sont disponibles gratuitement et à tout moment. Elles peuvent être utilisées dans des domaines d’application variés allant de la médecine à la politique, en passant par la finance, le tourisme et le marketing.

En marketing, la fréquence d’utilisation des termes de recherche est un indicateur de leur popularité. Cette information est utilisée pour concevoir des sites Internet de manière à ce que ces termes apparaissent le plus haut possible dans les résultats de recherche. Les entreprises peuvent ainsi augmenter leur visibilité sur Internet et mieux se positionner par rapport à leurs concurrents[4].

Dans le secteur financier, les chercheurs constatent qu’une augmentation du nombre de recherches effectuées sur une action boursière dans le moteur de recherche de Google se traduit par une hausse du cours de celle-ci dans les deux semaines suivantes[5]. D’autres chercheurs ont démontré, au moyen d’une analyse des variations du volume de recherche sur Google concernant des termes financiers, que certains modèles peuvent être interprétés comme des signes avant-coureurs de changements sur le marché des actions[6] .

Dans le secteur touristique, les données de recherche Google portant sur les musées et les galeries d’art permettent d’établir assez rapidement des estimations du nombre de visiteurs[7].

Les données de requêtes sur Google sont également utilisées dans le domaine de la recherche médicale[8]. L’analyse des données en temps réel peut livrer des indications sur les maladies saisonnières actuelles ou à venir ainsi que sur les épidémies. Plusieurs travaux de recherche se sont récemment penchés sur le suivi de la pandémie de Covid-19 basé sur les données issues de Google Trends[9].

Estimation du produit intérieur brut

Il est également possible d’obtenir des informations sur l’évolution d’une économie en temps réel[10], ce qui s’est avéré particulièrement intéressant au printemps 2020 et par la suite, car les données ont permis d’évaluer l’impact du confinement et des mesures de lutte contre la pandémie de Covid-19. Les données classiques utilisées pour estimer le produit intérieur brut (PIB) n’étant publiées qu’avec un certain décalage dans le temps, seules quelques informations sont disponibles sur la situation courante de certains secteurs économiques.

Quand l’économie traverse une phase singulière, comme ce fut le cas lors de la pandémie, il est crucial de disposer d’informations en temps réel afin d’évaluer les conséquences économiques potentielles de la crise et de prendre les mesures appropriées. On trouve aujourd’hui dans la littérature scientifique de nombreux travaux consacrés à l’estimation du PIB en temps réel sur la base des données de Google Trends[11].

Un outil précieux sans être la panacée

Depuis que Google publie des données sur les requêtes de recherche, scientifiques et praticiens issus des domaines les plus divers ont développé des idées pour les exploiter. Cependant, effectuer des analyses de données en s’appuyant sur Google Trends nécessite impérativement de se poser deux questions: à quoi faut-il veiller lors de l’utilisation de ces données et dans quelle mesure servent-elles le but de l’analyse? Les conclusions de travaux scientifiques existants peuvent aider à répondre à ces questions[12].

On a notamment constaté qu’une même recherche (c’est-à-dire sur le même terme de recherche, la même région et la même période) effectuée à différents moments peut générer des séries temporelles différentes. En outre, toutes les personnes qui effectuent une recherche sur le terme «corona» sur Google n’ont pas été infectées par le fameux virus. Malgré les failles et les nombreuses critiques, la littérature scientifique et la pratique s’accordent à dire que Google Trends constitue un instrument utile et complémentaire pour un grand nombre de questions.

  1. Voir p. ex. D’Amuri et Marcucci (2017), Yu et al. (2019), Penna et Huang (2009), Ferrrara et Simoni (2019), Narita et Yin (2018), Vosen et Schmidt (2011) ainsi que Vosen et Schmidt (2012). []
  2. Voir Google Trends. []
  3. Pour des explications sur ce paragraphe, voir notamment D’Amuri et Marcucci (2017) ainsi que Nagao, Takeda et Tanaka (2019). []
  4. Search Engine Optimization (SEO ou optimisation du référencement). Voir également à ce sujet Almukhtar, Mahmoodd et Kareem (2021). []
  5. Da, Engelberg et Gao (2011). []
  6. Preis, Moat et Stanley (2013). []
  7. Botta, Preis et Moat (2020). []
  8. Pour un aperçu des différentes études réalisées dans le domaine de la médecine, voir Mavragani, Ochoa et Tsagarakis (2018). []
  9. Voir Mavragani et Gkillas (2020). []
  10. Voir par exemple Vosen et Schmidt (2011) ou Ferrrara et Simoni (2019). []
  11. Voir Bantis, Clements et Urquhart (2023), Woloszko (2020), Kohns et Bhattacharjee (2023). []
  12. Pour des explications à ce sujet, voir par exemple Cebrián et Domenech (2023), Eichenauer et al. (2022), Arora, McKee et Stucker (2019) ou Lobe (2022). []

Bibliographie
  • Almukhtar F., Mahmoodd N. et Kareem S. (2021). Search Engine Optimization: A review. Applied Computer Science, 17(1), pp. 70-80.
  • Arora V. S., McKee, Stucker M. et D. (2019). Google Trends: Opportunities and limitations in health and health policy research. Health Policy, 123(3), pp. 338-341.
  • Bantis E., Clements M. P. et Urquhart A. (2023). Forecasting GDP growth rates in the United States and Brazil using Google Trends. International Journal of Forecasting, 39, pp. 1909-1924.
  • Botta F., Preis T. et Moat H. S. (2020). In search of art: rapid estimates of gallery and museum visits using Google Trends. EPJ Data Sci., 9(14).
  • Cebrián E. et Domenech J. (2023). Is Google Trends a quality data source? Applied Economics Letters, 30(6), pp. 811-815.
  • D’Amuri F. et Marcucci J. (2017). The predictive power of Google searches in forecasting US unemployment. International Journal of Forecasting, 33, pp. 801-816.
  • Da Z., Engelberg J. et Gao P. (2011). In Search of Attention. The Journal of Finance, October, 66(5), pp. 1461-1499.
  • Eichenauer V.Z. et al. (2022). Obtaining consistent time series from Google Trends. Economic Inquiry, 60(2), 694-705.
  • Ferrara L. et Simoni A. (2019). Évaluation en temps réel du PIB avec des données Google: une approche par présélection et réduction de la dimension, Document de travail no 717, Banque de France.
  • Kohns D. et Bhattacharjee A. (2023). Nowcasting growth using Google Trends data: A Bayesian Structural Time Series model. International Journal of Forecasting, 39(3), pp. 1384-1412.
  • Lobe A. (2022). Google Trends: Ein vielversprechendes Instrument für die Wissenschaft? Neue Zürcher Zeitung NZZ, 8 mars.
  • Mavragani A. et Gkillas K. (2020). Covid‑19 predictability in the United States using Google Trends time series. Nature – Scientific Reports 10, 20693.
  • Mavragani A., Ochoa G. et Tsagarakis K. P. (2018). Assessing the Methods, Tools, and Statistical Approaches in Google Trends Research: Systematic Review. Journal Of Medical Internet Research, 20(11).
  • Nagao S., Takeda F. et Tanaka R. (2019). Nowcasting of the U.S. unemployment rate using Google Trends. Finance Research Letters 30, pp. 103-109.
  • Narita F. et Yin R. (2018). In Search of Information: Use of Google Trends’ data to narrow information gaps for low-income developing countries, document de travail du FMI no 2018/286.
  • Penna N. D. et Huang H. (2009). Constructing consumer sentiment index for U.S. using Google Searches. Departement of Economics University of Alberta, document de travail no2009 – 26.
  • Preis T., Moat H. et Stanley H (2013). Quantifying trading behavior in financial markets using Google Trends. Sci Rep 3, 1684.
  • Vosen S. et Schmidt T. (2011). Forecasting private consumption: survey‐based indicators vs. Google trends. Journal of Forecasting, 30(6), pp. 565-578.
  • Vosen S. et Schmidt T. (2012). A monthly consumption indicator for Germany based on Internet search query data. Applied Economic Letters, 19(7), pp. 683-687.
  • Woloszko N. (2020). Tracking activity in real time with Google Trends. Document de travail no 1634 du Département des Affaires économiques de l’OCDE.
  • Yu L et al. (2019). Online big data-driven oil consumption forecasting with Google trends. International Journal of Forecasting, volume 35, pp. 213-223.

Bibliographie
  • Almukhtar F., Mahmoodd N. et Kareem S. (2021). Search Engine Optimization: A review. Applied Computer Science, 17(1), pp. 70-80.
  • Arora V. S., McKee, Stucker M. et D. (2019). Google Trends: Opportunities and limitations in health and health policy research. Health Policy, 123(3), pp. 338-341.
  • Bantis E., Clements M. P. et Urquhart A. (2023). Forecasting GDP growth rates in the United States and Brazil using Google Trends. International Journal of Forecasting, 39, pp. 1909-1924.
  • Botta F., Preis T. et Moat H. S. (2020). In search of art: rapid estimates of gallery and museum visits using Google Trends. EPJ Data Sci., 9(14).
  • Cebrián E. et Domenech J. (2023). Is Google Trends a quality data source? Applied Economics Letters, 30(6), pp. 811-815.
  • D’Amuri F. et Marcucci J. (2017). The predictive power of Google searches in forecasting US unemployment. International Journal of Forecasting, 33, pp. 801-816.
  • Da Z., Engelberg J. et Gao P. (2011). In Search of Attention. The Journal of Finance, October, 66(5), pp. 1461-1499.
  • Eichenauer V.Z. et al. (2022). Obtaining consistent time series from Google Trends. Economic Inquiry, 60(2), 694-705.
  • Ferrara L. et Simoni A. (2019). Évaluation en temps réel du PIB avec des données Google: une approche par présélection et réduction de la dimension, Document de travail no 717, Banque de France.
  • Kohns D. et Bhattacharjee A. (2023). Nowcasting growth using Google Trends data: A Bayesian Structural Time Series model. International Journal of Forecasting, 39(3), pp. 1384-1412.
  • Lobe A. (2022). Google Trends: Ein vielversprechendes Instrument für die Wissenschaft? Neue Zürcher Zeitung NZZ, 8 mars.
  • Mavragani A. et Gkillas K. (2020). Covid‑19 predictability in the United States using Google Trends time series. Nature – Scientific Reports 10, 20693.
  • Mavragani A., Ochoa G. et Tsagarakis K. P. (2018). Assessing the Methods, Tools, and Statistical Approaches in Google Trends Research: Systematic Review. Journal Of Medical Internet Research, 20(11).
  • Nagao S., Takeda F. et Tanaka R. (2019). Nowcasting of the U.S. unemployment rate using Google Trends. Finance Research Letters 30, pp. 103-109.
  • Narita F. et Yin R. (2018). In Search of Information: Use of Google Trends’ data to narrow information gaps for low-income developing countries, document de travail du FMI no 2018/286.
  • Penna N. D. et Huang H. (2009). Constructing consumer sentiment index for U.S. using Google Searches. Departement of Economics University of Alberta, document de travail no2009 – 26.
  • Preis T., Moat H. et Stanley H (2013). Quantifying trading behavior in financial markets using Google Trends. Sci Rep 3, 1684.
  • Vosen S. et Schmidt T. (2011). Forecasting private consumption: survey‐based indicators vs. Google trends. Journal of Forecasting, 30(6), pp. 565-578.
  • Vosen S. et Schmidt T. (2012). A monthly consumption indicator for Germany based on Internet search query data. Applied Economic Letters, 19(7), pp. 683-687.
  • Woloszko N. (2020). Tracking activity in real time with Google Trends. Document de travail no 1634 du Département des Affaires économiques de l’OCDE.
  • Yu L et al. (2019). Online big data-driven oil consumption forecasting with Google trends. International Journal of Forecasting, volume 35, pp. 213-223.

Proposition de citation: Karagök, Yavuz (2024). Prédire l’avenir grâce aux données des moteurs de recherche. La Vie économique, 15 août.