Twitter peut-il prédire l’évolution des marchés financiers ?

boule de cristal-Chez Pitch-(CC BY 2.0)

Twitter est-il la nouvelle boule de cristal des marchés financiers ? Des idées reçues et des réponses.

Par Thomas Renault

boule de cristal-Chez Pitch-(CC BY 2.0)
boule de cristal-Chez Pitch-(CC BY 2.0)

 

Depuis vendredi, un article publié par Les Échos intitulé « Comment Twitter est devenu la boule de cristal des marchés financiers » fait un bon petit buzz sur les réseaux sociaux. Réalisant ma thèse de doctorat sur ce sujet depuis maintenant près de trois ans, j’ai tendance à être assez psychorigide à propos de cette thématique, surtout que les mêmes mythes et les mêmes erreurs reviennent très souvent dans les articles de presse traitant de Twitter en tant qu’outil de « First-Story Detection » (détection d’événement) et d’analyse du sentiment des investisseurs. Voici les quelques erreurs classiques (dont certaines présentes dans l’article des Échos) et divers commentaires personnels sur l’utilisation possible de la « boule de cristal » Twitter pour prévoir l’évolution des marchés.

Pourquoi Twitter pourrait permettre de prévoir l’évolution des marchés ? Deux théories peuvent expliquer cela : d’abord, une théorie « informationnelle », ne remettant donc pas en cause nécessairement l’hypothèse d’efficience des marchés, supposant que l’information publiée sur Twitter est nouvelle (au sens non-intégrée dans les prix) et peut donc modifier la valeur anticipée rationnellement des cash-flows futurs d’un actif (et donc son prix actuel) ; ensuite, une théorie « sentimentale », proche de la finance comportementale, supposant que le prix d’un actif peut dévier de sa valeur fondamentale temporairement en fonction du sentiment des investisseurs « naïfs » (basé sur un modèle du type DeLong & al., 1990, « Noise Trader Risk in Financial Markets »), et que Twitter peut être utilisé justement pour mesurer ou anticiper le sentiment des investisseurs. Dans le premier cas, le choc est permanent (information nouvelle) et dans le second, il est temporaire (hausse du prix suite à un excès d’optimisme puis baisse par la suite, avec, en théorie, un retour à une certaine valeur fondamentale).

Dans les deux cas, si vous êtes capables d’avoir une information nouvelle grâce à Twitter ou si le sentiment des investisseurs a un impact sur le prix d’un actif (voir Baker & Wurgler, « Investor Sentiment in the Stock Market », 2007) et que Twitter permet de mesurer le sentiment des investisseurs, alors vous pouvez gagner de l’argent en mettant en place une stratégie basée sur Twitter.

Sauf qu’en réalité, en l’état actuel de la recherche, les résultats à ce propos sont très mitigés.

La première grosse erreur commise par les médias est de reprendre en boucle l’étude de Bollen & Mao de 2011, « Twitter mood predicts the stock market » en annonçant que cette étude montre que « les données de Twitter peuvent prédire l’évolution de l’indice du Dow Jones avec 87,6% de fiabilité ». Alors oui, c’est effectivement ce qu’il y a écrit dans l’abstract du papier de Bollen & Mao, sauf qu’en lisant le papier, il est possible de se rendre compte rapidement de la fragilité des résultats de cette étude. Attention, je ne dis pas que ce papier est faux ou foncièrement mauvais : l’innovation méthodologique apportée par les auteurs est par exemple très intéressante (utilisation de données Twitter, analyse de sentiment…). Par contre je suis clairement sceptique sur les résultats, principalement parce que la précision du modèle est testée « out-of-the-sample » sur une période allant du 1er décembre 2008 au 19 décembre 2008, soit 15 jours de trading ! 15 jours, en données daily (donc une étude sur 15 points) ! De plus cette étude ne s’intéresse pas au rendement d’une stratégie de trading basée sur Twitter, mais simplement à une prévision de la direction du marché (est-ce que le marché va monter ou bien est-ce qu’il va baisser). Pour finir, six modèles différents sont testés et le résultat mis en avant est celui du meilleur modèle, ce qui a tendance à clairement biaiser les résultats (en testant un grand nombre de stratégies purement aléatoires sur un nombre de points limités, la meilleure stratégie aura statistiquement une précision proche de 100%…).

« To assess the statistical significance of the SOFNN achieving the above mentioned accuracy of 87.6% in predicting the up and down movement of the DJIA we calculate the odds of this result occurring by chance. The binomial distribution indicates that the probability of achieving exactly 87.6% correct guesses over 15 trials (20 days minus weekends) with a 50% chance of success on each single trial equals 0.32%. »

Plus récemment, deux très bons papiers ont été publiés par Timm Sprenger : « Tweets and Trades : the Information Content of Stock Microblogs » (European Financial Management, 2014) et « News or Noise? Using Twitter to Identify and Understand Company-specific News Flow » (Journal of Business Finance and Accounting, 2014), dont les conclusions sont nettement moins « boule de cristal » que celles du papier de 2011 de Bollen & Mao. Selon Sprenger, une stratégie de trading basée sur Twitter ne permet pas d’obtenir un rendement ajusté du risque (rendement anormal) significativement différent de 0 (en intégrant les coûts de transactions). Ce qui peut se résumer par la dernière phrase du papier de Sprenger « Until then, picking the right tweets remains just as difficult as making the right trades ».

Cela ne signifie pas cependant que Twitter ne puisse pas être, dans le futur, une sorte de boule de cristal des marchés financiers. Mais en l’état actuel de la recherche, j’aurais plutôt tendance à m’appuyer sur les conclusions de Sprenger ou bien encore sur la revue de littérature « Walking Down Wall Street With a Tablet: a Survey of Stock Market Predictions Using the Web » (Nardo & al. 2015, Journal of Economic Surveys), concluant pour faire simple que « c’est prometteur, il y a sûrement des choses à faire, mais globalement, pour le moment, on n’en sait trop rien » (la réalité empirique académique est souvent très « normande »).

« In this paper, we ask whether online news has any influence on the financial market, and we also investigate how much influence it has. We explore the burgeoning literature on the predictability of financial movements using online information and report its mixed finding (résultats mitigés) » – Nardo & al., 2015, JES

La seconde erreur, plus récente celle-là, consiste à dire que la Banque Centrale Européenne (BCE) a confirmé le côté « boule de cristal » de Twitter, en se basant sur le papier « Quantifying the effects of online bullishness on international financial markets » publié il y a une quinzaine de jours sur le site de la BCE. Pourtant, et cela est clairement indiqué sur la première page de l’article, les papiers publiés dans les « Statistics Papers » de la BCE ne représentent absolument pas la vision de l’institution. Aucun des auteurs de ce papier ne travaille pour la BCE (c’est une simple revue qui publie des contributions externes), et ce fameux « nouveau papier de la BCE » est en réalité une reprise avec mise à jour d’un article de 2011 de Mao & al. « Predicting Financial Markets: Comparing Survey, News, Twitter and Search Engine Data », présenté lors d’un workshop à la BCE « Using Big Data for Forecasting and Statistics ».

« This Statistics Paper should not be reported as representing the views of the European Central Bank (ECB). The views expressed are those of the authors and do not necessarily reflect those of the ECB ».

BCE-Santi Villamarin-(CC BY-ND 2.0)
BCE-Santi Villamarin-(CC BY-ND 2.0)

Cela ne paraît peut-être pas très important, et vous trouvez peut-être que je joue sur les mots, mais il y a en réalité une différence entre ce que disent les membres de la BCE et ce qui peut être publié dans les divers Working Paper Series de la BCE, qui sont des travaux de recherche ne représentant pas (enfin pas nécessairement) la vision de l’institution. Bref, la Banque Centrale Européenne n’a rien dit sur Twitter (et ce n’est d’ailleurs pas son rôle non plus… sauf à supposer que Twitter remette en cause le mandat de stabilité des prix de la BCE… ce qui implique un léger abus d’alcool). À la rigueur, la BCE pourrait intégrer un indicateur Twitter pour « nowcaster » l’inflation (un peu à la manière des recherches sur Google de la Bank of England « Using internet search data as economic indicators »), mais c’est une autre histoire.

Continuons joyeusement avec la troisième erreur : voir des causalités partout à partir de simples corrélations. Dans l’article des Échos, il est par exemple écrit : « À l’époque, Bloomberg en avait également profité pour sauter le pas en ajoutant les messages Twitter à son offre de services financiers quotidiens. Dans les semaines qui suivent, les ‘flashs crashs’ s’enchaînent. » Alors oui, le fait que des algos de trading haute-fréquence puissent analyser en temps réel le contenu des tweets (et tout autre flux d’information – articles, blogs, forums…) pour prendre des positions peut en effet déstabiliser les marchés en augmentant la volatilité… Je n’ai rien contre cette hypothèse, mais comme toute hypothèse, il va falloir prouver cela empiriquement en « contrôlant » le tout pour considérer l’ensemble des autres explications possibles. Mis à part le piratage du compte Twitter de l’Associated Press, qui a effectivement créé un mini flash-crash avec une causalité identifiée, le rôle de Twitter dans les autres Flash Crash est loin d’être évident.

Et allez, une quatrième et dernière erreur pour la route (là-dessus, l’article des Échos ne tombe pas dans ce piège… mais d’autres oui) : avoir l’impression que dès que les marchés bougent à la suite d’un tweet, c’est forcément de la manipulation ou un mouvement irrationnel. Aux États-Unis, les entreprises et fonds cotés peuvent utiliser les réseaux sociaux pour divulguer des informations nouvelles aux investisseurs (voir « Une entreprise peut-elle utiliser les réseaux sociaux pour dévoiler une information nouvelle ? » et « SEC Says Social Media OK for Company Announcements if Investors Are Alerted »). Dans le cas d’un mouvement rapide suite à une information de la part d’un CEO, d’un gérant de fonds ou autres (par exemple « Analyse haute-fréquence du « tweet à 11 milliards » ou « Le tweet à 1 milliard d’Elon Musk sur Tesla : Analyse et Régulation – $TSLA »), il n’y a aucune raison de crier directement à l’irrationalité des marchés : Twitter est alors uniquement un nouvel outil de divulgation de l’information, et il est possible que si l’information avait été publiée par un autre canal de communication (communiqué de presse par exemple), la réaction aurait été la même (à tester empiriquement… of course).

La question n’est donc pas vraiment « est-ce que Twitter peut faire bouger les marchés ? », car en présence d’information nouvelle et étant donnée la position de la Securities and Exchange Commission, la réponse est clairement oui. L’important est de déterminer si cette dissémination de l’information via Twitter plutôt que via un moyen de communication plus classique modifie l’intégration de l’information dans les prix (vitesse d’intégration, volatilité, impact sur le sentiment des investisseurs…) tout en considérant les avantages (plus de transparence) et les risques (manipulations).

Conclusion

Voilà, c’est terminé pour la psychorigidité (enfin pour aujourd’hui) ! Tout cela pour dire que :

  • Les résultats empiriques sont pour le moment très mitigés, Twitter n’est clairement pas une « boule de cristal » permettant de prévoir les marchés, mais plutôt « un bon miroir » reflétant la situation présente,
  • La BCE n’a rien à voir avec Twitter,
  • Passer de la corrélation à la causalité nécessite des études empiriques bien plus poussées (je travaille dessus et deux papiers de recherche à ce sujet devraient sortir d’ici 12 mois),
  • Il existe une différence énorme entre « Twitter fait bouger les marchés » et « il est possible d’utiliser Twitter pour prévoir l’évolution des marchés », car, si l’information est intégrée quasi-instantanément dans les prix (avec « jump »), prévoir les marchés dans cette situation implique de pouvoir prévoir les tweets (et non pas simplement d’analyser les tweets existants).


Sur le web