Chronique : Databricks lève 1 milliard de dollars

Databricks BY Zeyi Fan(CC BY-NC 2.0) — Zeyi Fan, CC-BY

Databricks a levé 1 milliard de dollars ! Cette levée de fond fait passer sa capitalisation à 28 milliards de dollars, en pleine crise sanitaire.

Par Juvénal Chokogoué.

Une nouvelle importante est arrivée en début février, cette nouvelle nous donne une indication de l’état de santé du marché du Big Data, et nous ne pouvions ne pas en parler.

La nouvelle en question est la suivante : Databricks a levé 1 milliard de dollars ! 1 mil-liard ! Cette levée de fonds fait passer sa capitalisation à 28 milliards de dollars, en pleine crise sanitaire.

Décidément, cette année est particulière. Le monde est censé être en pleine crise et pourtant des entreprises engendrent des milliards de dollars. Après le bitcoin qui n’en finit plus de monter, Tesla qui a une capitalisation boursière qui dépasse celle du groupe Renault, Volkswagen, Toyota et Ferrari combinés alors qu’elle n’a vendu que 499 000 véhicules (on ne parle même pas des 11 millions de véhicules vendus par Volkswagen à elle toute seule !), c’est au tour de Databricks de nous choquer après une levée de fonds record de 1 milliard de dollars et une valorisation boursière de 28 milliards.

Alors, on rappelle quand même que Databricks est la société qui commercialise une version payante d’Apache Spark, le framework de calcul distribué réclamé aujourd’hui par toutes les entreprises qui font sérieusement du Big Data.

On rappelle également que son co-fondateur Matei Zaharia, est le développeur qui a créé Spark à l’université de Berkeley.

Du coup, une telle valorisation a forcément des impacts sur le marché. Dans cette chronique, nous allons réfléchir ensemble sur les impacts potentiels de cette levée de fonds sur le marché du Big Data. Attention, cette analyse est mon point de vue personnel.

Commençons par les bases.

Qui est Databricks ?

Databricks est une start-up (société à recherche d’un modèle économique scalable) qui a été co-créée en 2011 par Matei Zaharia pour commercialiser Apache Spark. Certes, Spark reste toujours open-source, mais l’entreprise fournit une version commerciale avec tout un écosystème d’outils autour (comme MLFlow) pour faciliter sa prise en main.

Cette année, l’entreprise aura 10 ans, mais elle n’est pas vraiment considérée comme un éditeur logiciel classique au même titre qu’un SAP ou un Microsoft par exemple. Jusqu’aujourd’hui, à San Francisco, l’entreprise est toujours considérée comme une start-up (ou comme une licorne comme on dit en France).

Au fil des années, l’entreprise a fait évoluer son modèle économique, quittant de la simple vente de licences Spark avec des outils simplificateurs (comme MLFlow) au développement d’une plateforme de traitement BI/Big Data unifiée (qu’elle appelle aujourd’hui Delta Lake). En clair, l’entreprise s’est peu à peu lancée sur le même terrain que Snowflake et aujourd’hui les deux entreprises sont rivales.

En lançant sa plateforme unifiée, l’entreprise a également changé de modèle économique et est quittée d’une tarification On-premise (une licence par utilisateur et par serveur/unité de calcul) pour une tarification par abonnement en Pay-as-you-Go (facturation à l’usage). En gros, l’entreprise est passée à un modèle full cloud et a commencé à offrir sa plateforme (Spark principalement) en mode SaaS.

Et là, boum ! Grâce à ce changement, l’entreprise a rencontré son succès (années 2018-2019), et là où justement Cloudera, Hortonworks et MapR ont raté le virage du cloud (parce qu’essoufflés à cause de la concurrence agressive que leur menaient Amazon et Microsoft avec leur Cloud respectif Aws et Azure), Databricks a su tirer son épingle du jeu.

Alors que Amazon et Microsoft ont réussi à créér un équivalent de toutes les technos Big Data open source (leur propre SGBD NoSQL, leurs propres outils devops, leurs propres technos SQL, etc.), ils n’ont pas réussi à créer… leur propre Spark. Du coup, ils ont pris la décision futuriste d’investir dans le capital de Databricks en tant qu’actionnaires et de proposer Spark Databricks dans leur cloud respectif.

Ainsi, lorsque votre entreprise souscrira à un cloud, vous y verrez un Spark Open source, et un Spark Databricks (avec des appellations commerciales différentes bien évidemment). La seule différence c’est que le Spark Databricks vient avec un tas d’outils qui facilitent sa prise en main, mais cette fois dans le cloud.

Maintenant les bases ont été posées pour mieux apprécier ce qui se cache derrière le milliard de levées de fonds et les impacts potentiels sur le marché du Big Data.

Un milliard de levées de fonds ? Quand même !

En marketing, il un adage dit : « subscribers are betters than customers », en français, le sens littéral c’est : « avoir des abonnés c’est mieux qu’avoir des clients ».

Pour une start-up la valorisation de 28 milliards de Databrick semble de prime abord ressembler à une grosse spéculation similaire à celle de Tesla, mais ce n’est pas le cas. Souvenez-vous, lorsqu’une entreprise vend un logiciel en mode SaaS, donc par abonnement, les clients payent un montant récurrent pour avoir accès au service. Cela signifie que ceux-ci ont une lifetime value plus grande que celle des clients qui achètent le produit sans abonnement.

En clair, les clients par abonnement dépensent plus dans le temps que les clients qui ne sont pas abonnés ; c’est au passage pourquoi Amazon nous incite tant à nous abonner à Prime…

Mais alors, ça veut dire que la tarification par abonnement est un mauvais deal pour nous les clients ?

Non ! Pas du tout ! L’intérêt d’un client c’est qu’il n’est plus obligé d’immobiliser une somme importante dès le départ pour acquérir le produit. Du coup, il peut utiliser le reste d’argent non immobilisé dans l’achat du produit pour faire autre chose.

En période difficile comme celle-ci, la tarification par abonnement est la bienvenue parce qu’elle permet aux entreprises (et à tout le monde) de ne pas bloquer ses liquidités dans des achats de produits. Puisque sans visibilité sur ce qui va se passer le lendemain, il serait prudent d’avoir des liquidités pour faire face à toute situation et éventuellement maintenir sa tête hors de l’eau le plus longtemps possible.

Je travaillais justement avec un client récemment qui me disait qu’il migre ses applications Big Data dans le cloud parce qu’avec l’augmentation significative du volume de données, augmenter les nœuds sur son cluster commençait à lui coûter cher ! Les nœuds ont beau être de simples PC commodes de 8 Go de RAM avec des dual-core de 2Ghz, à force, ça fait beaucoup de budget immobilisé sur un seul projet ! Le cloud apparaît donc comme une solution qui apaise le budget.

Databricks : quel lien avec sa levée de fonds ?

Il faut dire que le timing de Databricks pour son nouveau modèle économique était parfait ! 2018, ce n’était pas déjà la grande forme du côté des entreprises, et les temps difficiles commençaient à s’annoncer. L’offre de la société a rencontré un succès fulgurant et très rapide comme en attestent ses chiffres : lors de sa clôture d’exercice de 2020 (il y a quelques semaines), Databricks a révélé avoir un ARR de 425 millions de dollars, en hausse de 75 % par rapport à l’année dernière.

L’ARR, Annual Recurring Revenue (Revenu Annuel Récurrent) est la statistique la plus importante dans un modèle de facturation à l’abonnement. Lorsque l’on est sur des modèles économiques sans abonnement, la statistique qu’on regarde pour une entreprise c’est le chiffre d’affaires. Mais pour une entreprise en facturation à l’usage, c’est l’ARR – le chiffre d’affaires récurrent (en gros le nombre d’abonnés, en valeur).

Maintenant je vais vous poser une question : supposez que votre cousin a développé un business de vente de fleurs, il vient vous voir pour vous demander d’investir 10 000 euros dans sa boîte pour se développer. Supposez que dans son argumentaire, il vous montre les chiffres et vous voyez qu’il a 15 hôtels et 3 restaurants étoilés qui ont souscrit à un abonnement mensuel de livraison de fleurs chez lui. Allez-vous accepter d’investir et d’injecter vos 10 000 euros dans son business ?

Bon, je vais supposer que c’est mon cousin. Analysons la situation : supposons que son service de livraison de fleurs coûte 100 euros par mois. Cela signifie que mon cousin a un ARR de 100 * (15 + 3) * 12 mois = 21 600 euros. Donc, je sais que mon cousin dispose à coup sûr de 21 600 euros chaque année, sans croissance.

Comment valorise-t-on une société dans notre ère ?

Alors la valorisation de société est très complexe. Mais très simplement la valorisation est égale au chiffre d’affaires de la société multiplié par trois. Cela signifie concrètement que si j’achète une société, j’amortis (récupère) mon capital dans trois ans.

Ce qui signifie que pour la société de mon cousin, s’il fait 21 600 euros de chiffre d’affaires, alors je pourrais investir jusqu’à 64 800 euros sans peur de perdre mon argent.

Donc réponse à mon cousin : oui ! J’investirais volontiers bien bien au-delà des 10 000 euros qu’il me demande.

C’est pareil avec Databricks. Comme la société a un ARR de 425 millions de dollars, en multipliant cette valeur par trois, on obtient une capitalisation de plus de un milliard de dollars !! Plus précisément, on obtient une capitalisation de 1,275 milliard. Donc avec ces chiffres (l’ARR), lever un milliard pour Databricks est un jeu. Elle pourrait même très bien aller en bourse si elle le voulait…

Finalement, la valorisation de 28 milliards est assez normale, car avec un tel ARR dont on sait qu’avec la pandémie il sera en hausse constante, les investisseurs (même moi) sont prêts à mettre de l’argent dans la société, et même beaucoup d’argent, car l’entreprise devient un placement sûr et trèès rentable sur le court-moyen-long terme.

Même si je ne suis pas fan de ce modèle économique, il faut tout de même reconnaître qu’il marche pour les vendeurs de logiciels en SaaS comme Databricks. Les entreprises qui ont souscrit au Spark de Databricks en cloud ne vont pas se désabonner ni partir chez un concurrent à cause d’une chose : le coût d’opportunité.

Quand une entreprise va en cloud, même en SaaS, elle y emmène le plus souvent ses données et ses applications. Le coût pour changer de fournisseur ou revenir est tellement grand qu’elle préfère y rester (sauf grave problème de SLA). Et d’ailleurs, les fournisseurs s’assurent toujours d’intégrer dans leur solution cloud un service qui rendrait votre décision de les quitter très pénible.

C’est pourquoi quand on prend un abonnement Microsoft office par exemple, l’entreprise nous offre automatiquement 1 To de stockage sur son service OneDrive, et propose systématiquement d’y enregistrer nos documents. Les 1 Go offerts peut sembler de l’argent perdu, mais ce n’est pas le cas, car Microsoft sait très bien qu’une fois que vous avez commencé à stocker vos documents dans son cloud, il vous est très difficile de vous en séparer. Même si un concurrent venait à vous proposer une meilleure offre, le coût de migration serait simplement trop douloureux !

C’est la même raison qui fait qu’on peut anticiper avec beaucoup de précision que l’ARR de Databricks ne va qu’augmenter dans le temps.

Quid de l’impact sur le Big Data ?

En 2019, j’avais traité un sujet similaire lors du rachat de Hortonworks par Cloudera. Globalement, j’avais dit que le rachat d’Hortonworks par Cloudera n’aurait aucune incidence sur le marché du Big Data, car les besoins du marché ont pour source les insuffisances des technologies utilisées pour valoriser les données.

La levée de fonds de Databricks est certes spectaculaire, mais comme nous vous l’avons démontré, elle n’est pas spéculative. Elle est basée sur de la bonne gestion et l’innovation de l’entreprise. Cette levée de fonds aura-t-elle un impact sur le marché du Big Data ? Personnellement je ne pense pas. J’ai vu la plateforme que l’entreprise propose (Delta Lake), et ça me semble être du déjà vu. Donc, les principes du traitement massivement parallèle demeurent, pas de changement de paradigme en vue.

Par contre d’un point de vue financier, j’ai peur que cette réussite n’entraîne une ruée vers l’or de la facturation en cloud de tous les éditeurs Big Data dans le simple but d’augmenter leur capitalisation boursière et donc générer au final une bulle spéculative similaire à bulle Internet des années 2000.

Le leasing quoique valorisant pour une entreprise du point de vue des investisseurs est un modèle économique fragile. Il vous suffit de voir la position des entreprises entièrement basées sur l’abonnement comme Spotify et Netflix pour comprendre de quoi je parle…

J’espère juste que cette réussite de Databricks ne va pas engendrer une ruée vers l’or du « modèle de facturation par abonnement », et plonger le monde dans une crise similaire à celle de la bulle technologique des années 2000.

Vous souhaitez nous signaler une erreur ? Contactez la rédaction.