Sovint sentim que les dades són objectives, que les dades són les que són. Tanmateix, quasi ningú no va directament als arxius que les contenen, plens de números, sinó que ens servim de representacions gràfiques per entendre-les millor. I és que els gràfics són tot un món. És per això que jugant una mica amb algunes de les seves parts es pot fer màgia, o més aviat bruixeria, perquè acostuma a ser malintencionada. Sense tocar ni una sola xifra dels documents originals, institucions, empreses i sobretot mitjans de comunicació són capaços d’enganyar a moltíssima gent amb dades reals. 

Abans de començar vull fer-te una pregunta: si mai estàs llegint una notícia i et trobes un titular que va acompanyat d’un gràfic, quan inspeccionaràs el gràfic més detalladament? Quan la conclusió t’agrada o quan no te la vols creure?

És possible que si estàs conforme amb la notícia, no dediquis massa temps al gràfic, perquè amb un cop d’ull ràpid ja tens una imatge que t’agrada, que et satisfà perquè concorda amb les teves idees. Aquest fenomen es coneix com a biaix de confirmació, interpretar la informació d’una forma incorrecta per confirmar les nostres idees. És en aquests casos quan et poden ensarronar i reforçar encara més una idea falsa, tal com passa en entorns negacionistes i pseudocientífics.

Què podem fer per evitar l’engany?

És molt important fixar-se en l’estructura del gràfic i no només en les dades representades.  Els eixos, les unitats, les escales i molts altres factors són fonamentals. Seguidament, et mostro una sèrie de representacions enganyoses i t’explico on tenen la trampa.

1. El comptador del Consell per la República

Aquest perfil de Twitter es dedica a publicar gràfics amb dades sobre el nombre d’inscripcions i persones registrades al Consell per la República. Periòdicament, un dels gràfics que pengen té com a subtítol: “Evolució de les inscripcions fetes durant els darrers 120 dies”, i observem una línia. Amb un cop d’ull ràpid veiem que, en els darrers 120 dies, el nombre d’inscrits s’ha disparat. Si pares més atenció, s’aprecia que el nombre d’inscrits s’ha pogut multiplicar per catorze (fixa’t que comença a la meitat del primer quadradet i puja fins a omplir el setè quadrat). Això és un gran augment!

1. Gràfic enganyós. Evolució de les inscripcions al Consell per la República segons el Comptador del Consell per la República Catalana.

Ara bé, mirem l’eix vertical, l’eix de les y, malgrat que no s’indiquen les unitats, les podem intuir pel subtítol: són el nombre de persones inscrites. Però alerta, l’eix no comença des del 0, comença des del membre 98.500! Això canvia radicalment la interpretació del gràfic: mirant la diferència entre el punt inicial i el final, veiem que l’increment real d’inscrits és només de 3.500 aproximadament. Això és només un 103,6% dels inscrits de fa 120 dies, no pas un 1.400% (catorze vegades els inicials). En conclusió, la nostra percepció era d’un increment astronòmic inexistent. El gràfic corregit de sota, és a dir, començant des de 0, ens permet veure que les inscripcions dels darrers 120 dies han estat poc significants al costat del total de membres previs.

2. Gràfic corregit. Evolució de les inscripcions al Consell per la República.

La veritat és que ens trobem davant d’un cas molt típic, tallar l’eix de les y per començar per un valor diferent de 0. Això és sempre incorrecte? No, a vegades és útil per mostrar fluctuacions de les nostres dades que començant des de 0 no es perceben adequadament. En aquests casos, però, cal indicar-ho, cal que l’eix tingui una marca de tall com la que assenyala la fletxa vermella de la següent imatge.

3. Gràfic per mostrar com cal indicar el tall a l’eix vertical quan no es comença de 0.

2. El descens del PIB a RTVE

En el context de l’estiu del 2020, el primer estiu en pandèmia, RTVE feia balanç de l’economia de l’estat espanyol al costat de la d’altres països de la Unió Europea. El gràfic de barres es titula “Les grans economies de la Unió Europea: caiguda trimestral a 2020” i hi observem quatre països en colors diferents: Alemanya, Espanya, França i Itàlia. Cadascun d’ells té dues barres que indiquen el canvi del producte interior brut (PIB) durant els dos primers trimestres del 2020: de gener a març i d’abril a juny. 

Malgrat que ens tornen a faltar les unitats de les barres —encara que es poden sobreentendre—, veiem com els quatre països han disminuït el seu PIB, especialment des del començament de la pandèmia. Però encara més important, sembla que tots quatre empitjoren de la mateixa manera, ja que les barres són igual de grans. El missatge és que podem estar tranquils, que la nostra evolució és igual de negativa que la de la resta.

  1. Gràfic enganyós. Evolució del PIB els dos primers trimestres del 2020 a quatre països segons RTVE.

Com abans, el misteri és a l’eix vertical. En primer lloc, hauríem de sospitar: per què posen els països per separat en quatre eixos de coordenades diferents? Doncs bé, mirant els números veiem que tots comencen al 0, però acaben en punts diferents: per exemple Alemanya acaba en -11 i Espanya en -20, l’escala és diferent! Afortunadament, l’allau de crítiques els va obligar a rectificar, mirem ara el gràfic correcte:

  1. Gràfic corregit. Evolució del PIB els dos primers trimestres del 2020 a quatre països segons la correció de RTVE.

En aquest cas sí que tenim una escala uniforme de 0 a -20 on podem veure que el PIB espanyol durant els dos trimestres va disminuir quasi el doble que l’alemany. També, aquí queda clar que, dels quatre països, el més afectat econòmicament per la pandèmia durant el segon trimestre de 2020 va ser Espanya.

Jugar amb les escales de la mateixa unitat amb diversos eixos a la vegada sempre és problemàtic, també amb altres formats com amb gràfics de línies com aquest:

  1. Comparació del PIB global i alemany de Datawrapper.de.

En aquest gràfic representen el PIB global en blau i l’alemany en salmó. Encara que podríem pensar que és útil per observar correlacions, és molt probable que sigui origen de confusió perquè representen la mateixa magnitud (el PIB), però les escales són diferents: l’escala blava és 20 vegades més gran. A més, els eixos verticals estan tallats, no comencen des de 0, cosa que juntament amb la diferència d’escala, genera una desproporció de les dades. Al gràfic de sota es veu com quedaria si allarguéssim els eixos fins al 0:

  1. Mostra de la distorsió respecte el 0 generada pels dos eixos amb diferents escales segons Datawrapper.de.

I aquest gràfic ens porta al següent, parlem de les correlacions absurdes.

3. La venda d’iPhones i les morts per caiguda per escales

Aquest cas és molt diferent dels que hem vist fins ara. No es tracta d’un gràfic enganyós, sinó d’una sàtira d’un recurs molt utilitzat per defensar tesis absurdes. Per tant, aquest gràfic no es caracteritza per un error de representació, sinó d’un error conceptual —encara que és cert que no han indicat amb un tall que l’eix dret comença des de 1900 i no 0—. 

Aquí veiem un gràfic de línies amb dos eixos verticals, a l’esquerra i en morat el nombre de mòbils iPhone venuts. A la dreta i en groc: la gent que ha mort d’una caiguda per les escales. Tot plegat mostra l’evolució d’aquestes dues variables entre el 2007 i el 2010. 

  1. Correlació entre la venda d’iPhones i les defuncions per caiguda per escales de Spurious Correlations.

Mirant el gràfic s’aprecia clarament com les dues tendències són quasi idèntiques, tenen un coeficient de correlació de 0,995 pràcticament perfecte (1 és la màxima correlació). Això vol dir que, com que cada vegada la gent té més mòbils, va més distreta caminant i per tant, cau per les escales mortalment més sovint? 

Bé, malgrat que és relativament versemblant, només amb aquesta informació no podem ni afirmar ni desmentir que les vendes d’aquests mòbils provoquin més morts per caiguda per escales. Cal tenir clara la cantarella: correlació no implica causalitat, és a dir, que dos esdeveniments segueixin tendències iguals no vol dir que un provoqui l’altre, ni que estiguin relacionats. Pot ser simplement casualitat o que ambdues vinguin donades per una tercera variable. 

Per exemple, existeix una correlació entre els atacs de taurons i les vendes de gelat. Vol dir això que menjar gelats et faci més deliciós pel taurons? O vol dir que les víctimes i testimonis d’atacs de taurons comencen a consumir compulsivament gelats? Segur que veus evident que no, és absurd. Així i tot, aquestes variables estan correlacionades, no per atzar, sinó perquè les dues venen donades per la calor i el bon temps de l’estiu.

  1. Correlació entre vendes de gelats i atacs de taurons.

Ja per acabar…

Aquestes només són algunes formes de desviar les conclusions, però n’hi ha moltes més. Per exemple, evitar normalitzacions, és a dir, comparar per exemple els casos de coronavirus a Catalunya amb els de Rússia. No té sentit fer-ho si no es tenen en compte factors com la població total de cada país.

Després podem trobar estratègies encara més fraudulentes com invertir els eixos, omplir els gràfics de moltíssims paràmetres perquè siguin incomprensibles, utilitzar colors verds i vermells per fer la sensació de bo i dolent, manipular estadístiques, etc.

En definitiva, els gràfics són una eina molt útil que ha de servir per mostrar les dades d’una forma clara i objectiva, tanmateix, amb alguns retocs maliciosos poden donar suport a la desinformació.

Extra: Verificat, els detectius de la desinformació

Per fer front a la desinformació et recomanem visitar Verificat, un projecte que analitza possible desinformació científica i política i la confirma o desmenteix amb l’ajuda d’evidències amb un gran rigor. Fes-li un cop d’ull al seu lloc web.

Per saber-ne més

WikipediaMisleading graphics

Statistics How toMisleading graphs: real examples

TylervigenSpurious correlations