El llenguatge és una de les qualitats que ens defineixen com a humans. Coneixem el món que ens envolta perquè l’assimilem en forma de paraules, les quals ens permeten establir relacions lògiques entre conceptes i comunicar-los a la resta de persones. Els següents versos de Miquel Martí i Pol resumeixen molt poèticament aquesta idea:

Miquel Martí i Pol
Tot, si ho mireu bé, convergeix en nosaltres
perquè ho anem assimilant,
perquè ho puguem convertir en paraules
i perduri en el temps,
el temps que no és res més
que un gran bosc de paraules.

L'arrel i l'escorça, Miquel Martí i Pol

Tanmateix, voler no sempre és poder. Les persones amb diferents graus de paràlisi saben el que volen dir, però els és impossible expressar-ho. Per mirar de superar aquest problema, recentment s’ha presentat una nova tecnologia que podria ajudar aquestes persones.

Com funciona el llenguatge?

L’IEC defineix el llenguatge com la “facultat humana de comunicar els propis pensaments o sentiments a un receptor mitjançant un codi lingüístic compartit”. Per tant, podem deduir que el llenguatge requereix dues etapes molt ben diferenciades:

  1. Pensem què volem dir.
  2. Ho comuniquem verbalment, tant oral com escrit, i no-verbalment amb moviments del cos.

Normalment, les persones amb paràlisi només poden pensar què volen comunicar. La primera part del llenguatge funciona perfectament, però els és biològicament impossible dur a terme la segona part. Aquest era, per exemple, el cas de Stephen Hawking. El seu cervell funcionava perfectament, però, per culpa de l’esclerosi lateral amniotròfica (ELA), no podia comunicar les seves idees.

Cervell llenguatge
En el cervell hi ha àrees dedicades al processament dels estímuls sensorials (tàctils, auditius i visuals) i a la materialització de la resposta (escorça motora primària). També n’hi ha dedicades a la producció del llenguatge (àrea de Broca) i a la seva comprensió (àrea de Wernicke).

Llavors, com podem comunicar el pensament?

Abans de parlar de les solucions, primer cal entendre que les dues etapes del llenguatge són asimètriques: la primera etapa va molt més de pressa que la segona. Dit d’altra manera, els pensaments flueixen més ràpidament que la nostra capacitat de comunicar-los. Això es pot veure clarament quan, sense voler, canviem de lloc les paraules, com en aquell famós “som sentiments i tenim éssers humans”. Sovint, intentem accelerar la parla per anivellar-la amb els pensaments, però acabem entortolligant el missatge.

Si aquesta diferència de velocitat ja és notable en les persones sanes, es transforma en un greu problema en les persones amb paràlisi. La tecnologia que s’ha fet servir fins ara es basa a escriure d’acord amb el moviment dels ulls, captant la direcció de l’òrbita ocular. La màxima velocitat que es pot assolir és d’unes 47 lletres/min, mentre que una persona sana pot escriure unes 115 lletres/min. Això vol dir que només s’arriba al 40% de la velocitat assolible.

Per augmentar la velocitat d’escriptura, cal eliminar intermediaris. En comptes d’escriure a partir d’una resposta mecànica (moviment dels ulls), recentment s’ha descobert que es pot fer servir directament l’activitat cerebral generada en la primera etapa del llenguatge. El mecanisme que llegeix els impulsos cerebrals i els tradueix a un senyal digital rep el nom de BCI (interfície cervell-ordinador, de l’anglès, brain-computer interface).

Així és com funciona la BCI

La BCI no és un mecanisme nou, sinó que ja s’ha fet servir anteriorment per moure implants, com ara braços biònics. Tanmateix, la principal diferència entre moure un braç i escriure un text és la complexitat de la tasca, ja que escriure és una activitat infinitament més complexa des del punt de vista cognitiu. Cal trobar un algorisme que relacioni cada patró cerebral amb una lletra de l’alfabet, i també amb cada espai i signe de puntuació del text. Tot això requereix una capacitat molt fina per distingir els patrons que apareixen al cervell quan escrivim. El funcionament de la BCI es pot simplificar en quatre etapes diferents:

  1. Pensem en una lletra en diferents paraules i contextos, i uns elèctrodes implantats a l’escorça cerebral llegeixen els patrons que es generen.
  2. La informació es processa per relacionar els diferents patrons amb cada lletra concreta. És el que es coneix com a deep-learning.
  3. La informació obtinguda es fa servir per predir les lletres a partir de l’activitat cerebral.
  4. La predicció de les lletres es refina i es tradueix en un text.
Etapes

Els resultats van ser sorprenents, ja que augmentaven la velocitat de 47 a 90 lletres/min (un 75% de la velocitat convencional). Pel que fa a la precisió, el model prediu correctament el 95% de les lletres. Tanmateix, és possible augmentar la precisió fins al 99% si s’apliquen mecanismes d’autocorrecció semblants als que fan servir els telèfons mòbils quan escrivim.

Però aquesta tecnologia no és perfecta…

El problema de les intel·ligències artificials (IA) és que necessiten moltíssimes hores d’entrenament. I, esclar, això comportaria tenir la persona asseguda en una cadira durant dies i dies per entrenar la màquina. Per superar aquest problema, es va seguir una estratègia força interessant. Es van fer servir els patrons cerebrals enregistrats per crear frases artificials, i així tenir més dades per entrenar la màquina. D’aquesta manera, multipliquem el nombre de dades per perfeccionar el model de predicció. 

Com ja hem comentat en reportatges anteriors, un altre problema de la tecnologia deep-learning és el seu impacte mediambiental. És ben conegut que consumeix molta energia i recursos, la qual cosa es tradueix en conseqüències negatives pel canvi climàtic.

Un tercer inconvenient és que el model s’ha de renovar dia rere dia. Amb el pas del temps, els patrons cerebrals canvien, així que la precisió de la predicció disminueix. Això implica treballar amb un deep-learning continu per tal d’adaptar-s’hi constantment. Si sumem aquest fet amb les conseqüències ambientals que acabem de mencionar, veiem que l’impacte negatiu es multiplica exponencialment.

Per últim, però no menys important, cal destacar l’abast d’aquesta nova tecnologia. De moment, l’estudi només s’ha dut a terme en anglès, una llengua relativament fàcil d’escriure sense lletres especials ni accents. Això posa noves preguntes sobre la taula. Què passarà amb les llengües amb una ortografia complexa, com ara l’hongarès? O, més complicat encara, les que fan servir alfabets o símbols diferents? Cal veure com es pot fer per impedir la discriminació de les minories lingüístiques.


Ja per acabar…

Una de les grans ironies del destí és la del poeta català que hem mencionat abans: Miquel Matí i Pol. Un gran mestre de la paraula i un dels millors poetes del segle XX, però que va acabar silenciat per l’esclerosi múltiple. Tot i que va morir amb 74 anys, l’esclerosi múltiple va disminuir-li la mobilitat i la capacitat de parlar a partir dels 40 anys. És un altre exemple, doncs, en el qual una malaltia limita el llenguatge d’una persona que es vol expressar.

Per saber-ne més

Nature – Neural interface translates thoughts into type

Dale Purves – Neuroscience

La Vanguardia – Así funcionaba el sistema de comunicación de Stephen Hawking


Els esquemes d’aquest reportatge s’han elaborat amb BioRender.