Offre légale et téléchargement : question statistique

smokers_dieSoit l’affirmation suivante, largement relayée et établie par des études a priori solides :

Ceux qui téléchargent le plus sont aussi les plus gros consommateurs de l’offre légale.

Considérons, en premier approche, cette affirmation comme vraie.

Il en vient très fréquemment la conclusion : “Le téléchargement est bon pour l’offre légale.”

Mais j’ai quelques questions :

  • Quelle est la proportion absolue d’offre légale dans ces habitudes de consommation ? Si un gros téléchargeur achète 1% de sa consommation quand un petit n’en achète que 0.90%, 1) nul ne saurait gagner sa vie ainsi 2) la différence est négligeable en volume, donc cela invalide la conclusion précédente.
  • Combien sont les plus gros téléchargeurs ? S’ils achètent au contraire 90% de leur consommation mais ne représentent que 2% de la population, cela invalide la conclusion précédente.
  • A-t-on étudié l’aisance vis–à-vis de la technologie ? Si un gros téléchargeur, de par son aisance vis-à-vis de l’informatique, achète quatre fois sur cinq le contenu qui l’intéresse, mais qu’un petit n’achète qu’une fois sur vingt, cela peut invalider la conclusion précédente.
  • Quid du manque à gagner ? Un créateur (ou une industrie culturelle) peut-il s’installer, apprendre de son public, s’il lui faut produire d’abord à perte avant de dégager le seuil de rentabilité qui lui permettra de vivre ? Cela peut là aussi invalider la conclusion précédente.

Ces questions n’étant pas (forcément) posées dans le but d’obtenir des réponses mais pour marteler la vérité suivante :

Une statistique n’est pas une conclusion : c’est une observation quantifiée.

Toujours penser aux effets voisins, à la sous-représentation, aux conjonctions, d’effets, etc. C’est seulement quand on les a évacués, scientifiquement, que l’on peut alors formuler une conclusion, laquelle n’est pas quantifiée, mais devient toujours qualitative (« en approche raisonnable, je peux probablement – à 95% de confiance, par exemple – considérer que… »).

J’ai une petite histoire édifiante à ce sujet : soit l’article suivant, “Le piratage nuit à l’économie : la preuve en chiffres” publié ici-même en 2010. J’y avançais la conclusion suivante (édifiante, bien sûr) :

L’augmentation phénoménale et terrifiante du stock d’armes nucléaires cumulé sur les États-Unis et l’URSS coïncide avec le développement d’Internet – et donc, des capacités de stockage et du piratage. Comme par hasard, le pic d’armement correspond au moment où l’espace de stockage moyen avoisinait les 650 Mo – soit la taille d’un CD audio ou d’un film en DivX. J’ignore quelle preuve supplémentaire il faut au monde : Internet a non seulement creusé la dette nationale des États-Unis, mais les disques durs sont directement responsables de l’instabilité politique de notre époque.

Une conclusion tout à fait convenable pour un 1er avril. (Pour ceux que ça intéresse, l’article est tout entier basé sur une erreur logique classique, le biais de corrélation : deux phénomènes en évolution conjointe ne sont pas nécessairement reliés de façon causale.)

Quelle n’a pas été ma surprise (et mon effroi) en constatant que cet article a été cité très sérieusement, deux ans plus tard, dans des travaux d’étudiant post-bac en ligne.

Auguste lectorat, tu es fort et vaillant, alors : NE SOIS PAS CES MECS.