« Anti-Piketty » : des données douteuses

Thomas Piketty-blu-news.org(CC BY-SA 2.0)

Le livre retrace la façon dont Thomas Piketty abuse de la confiance du lecteur en ce qui concerne les statistiques, la collecte des données et leur traitement.

Par Mathieu Bédard
Thomas Piketty-blu-news.org(CC BY-SA 2.0)
Thomas Piketty-blu-news.org(CC BY-SA 2.0)

 

Dans un billet précédent, où je présentais l’ouvrage collectif Anti-Piketty : vive le Capital au XXIe siècle !, j’en profitais pour dénoncer la vision tronquée de Thomas Piketty quant aux plus riches de ce monde. Je voudrais utiliser ce second billet pour vous parler de ce qui est le cœur de l’Anti-Piketty, c’est-à-dire la critique de ses données douteuses.

Jusqu’à maintenant, on croyait généralement que la force du livre de Thomas Piketty était ses données statistiques. Et quand on parle de statistiques, on a souvent l’impression que c’est incontestable, ancré dans la réalité, et donc solide comme le roc. La vérité, c’est que la qualité des statistiques est aussi très importante et dépend entre autres de la façon dont elles ont été collectées et traitées. L’Anti-Piketty nous apprend justement qu’il y a de gros problèmes de ces deux points de vue.

Thomas Piketty a bâti sa base de données statistiques sur les États-Unis à partir des déclarations d’impôts. Le problème, soulevé en détail par l’Anti-Piketty, c’est que les règles fiscales américaines ont beaucoup évolué pendant la période observée. Pour ne donner qu’un exemple, jusqu’à 1986 le fisc américain encourageait les personnes fortunées à gérer leurs affaires et leurs activités professionnelles à partir de compagnies spéciales, les SubChapter C Corporations, qui devaient remplir des déclarations d’impôts distinctes et séparées des déclarations d’impôt personnelles. À partir de 1986, le fisc a arrêté d’encourager cette pratique et ces sommes sont maintenant incluses dans les revenus personnels imposables.

Donc, même dans le cas théorique où les riches américains ne se seraient pas enrichis d’un seul sou depuis 1986, le montant de leur déclaration d’impôts aurait augmenté au fur et à mesure qu’ils abandonnaient leurs SubChapter C Corporations et rapatriaient ces sommes vers leur déclaration d’impôt personnelle. Les statistiques suggéreraient que les riches sont de plus en plus riches, alors qu’en réalité on observerait uniquement une modification de la façon dont est comptabilisé l’impôt.

La non-prise en compte des SubChapter C Corporations constitue une omission fondamentale qui remet en question tous les graphiques et tableaux de Thomas Piketty à propos de l’augmentation des inégalités. C’est là une seule des façons dont la fiscalité affecte les déclarations de revenus des Américains parmi plusieurs, mais Thomas Piketty n’en prend aucune en compte.

Le deuxième type de problème qui entache la thèse de Thomas Piketty, c’est son traitement des données. Pour n’importe quel économiste, une fois les données amassées, il faut souvent les traiter pour les rendre cohérentes avec le phénomène que l’on veut étudier. À ce stade, plusieurs jugements doivent être faits. Le problème mis en exergue par l’Anti-Piketty, c’est que le traitement des données effectué par Thomas Piketty est truffé de modifications injustifiables et malhonnêtes.

Par exemple, dans un graphique, Thomas Piketty n’hésite pas à présenter des courbes s’étalant sur tout le 19e siècle, alors qu’il n’a de données que pour 1810 et 1870. Un peu plus loin, quand le chiffre pour la décennie de 1910 contredit sa thèse, qui voudrait que le début du siècle ait été une période d’inégalité croissante, il invente tout simplement un nouveau chiffre.

Et ce n’est pas tout. Avant la thèse de Piketty, l’une des meilleures sources d’informations à propos des inégalités de revenus était une étude très complète des chercheurs Wojciech Kopczuk et Emmanuel Saez publiée en 2004. Piketty réutilise leurs données, comme c’est souvent la pratique en recherche universitaire. Cependant il utilise parfois, là où ça l’arrange et sans en expliquer la raison, des données issues d’autres études fondamentalement différentes. L’un des graphiques les plus populaires de la thèse de Piketty est ainsi construit comme un « Frankenstein » à partir de bribes d’autres bases de données, pour obtenir au final une courbe qui colle à sa théorie, mais qui n’est fidèle à aucune de ses sources.

Le traitement des données est quelque chose d’extrêmement complexe. Certains spécialistes se plaisent à dire que c’est un art plutôt qu’une science. Ainsi, prise une à une, chacune de ces modifications pourrait peut-être s’expliquer si Thomas Piketty s’en donnait la peine. Ce qui est impardonnable, en revanche, c’est que toutes ces manipulations introduisent un parti pris en faveur de sa thèse. Aucune n’est neutre ou à son désavantage. Lorsque réajusté par les auteurs de l’Anti-Piketty pour éliminer ces biais, le paysage des inégalités est fondamentalement différent de la thèse de Piketty.

Thomas Piketty a eu plusieurs occasions de justifier ces choix. À chaque fois, il ne l’a pas fait, mais s’est retranché derrière le fait qu’il rend sa base de données disponible aux vérifications. Cette transparence est, certes, la bienvenue mais elle ne devrait pas détourner l’attention des problèmes considérables mis au jour par les auteurs de l’Anti-Piketty.

Le livre retrace méticuleusement la façon dont Thomas Piketty abuse de la confiance du lecteur quant à ses statistiques, autant du point de vue de la collecte des données que de leur traitement. Vu le raz-de-marée médiatique qu’a déchaîné la thèse de Piketty, l’antidote que propose l’Anti-Piketty mérite d’être lu et compris.

Dans une prochaine et dernière chronique sur l’Anti-Piketty, nous verrons que ce n’est pas une exagération que de dire que Thomas Piketty a écrit un pamphlet marxiste, une idéologie discréditée depuis longtemps et qu’on croyait passée de mode.

Sur le web