Čo sa vám odohráva v hlave? Vedci už vedia preložiť myšlienky do slov

V posledných rokoch sa vyrojil rad ukážok toho, ako uplatniť umelú inteligenciu, čo je nepresná prezývka pre počítačové neurónové siete. Nástroje strojového učenia sa využívajú na preklad cudzích jazykov, generovanie tvárí aj videomontáž alebo k hraniu zložitých doskových hier.

Dnes sa však pozrieme na zaujímavý príklad, keď bola umelá inteligencia využitá na analýzu inej neurónovej siete. Tej tradičnejšej, ktorá strojové učenie inšpirovala. Vedci využili počítačovú neurónovú sieť k analýze činnosti neurónov v ľudskom mozgu, píše Technet.cz.

Mozog nezaznamenáva signály z uší tak, ako ich zaznamenáva napríklad diktafón na magnetofónovú pásku. V sluchovej kôre mozgovej, kam signály zo sluchového ústrojenstva prúdia, dochádza zrejme k akejsi interpretácii, napríklad na odlíšenie dôležitých zvukov od šumu. Funkčná magnetická analýza mozgu ukazuje, že inak napríklad vnímame slová v jazyku, ktorému rozumieme, a inak ostatné zvuky. Naše zmyslové vnímanie je naviac "rozsekané" do intervalov, mozog teda namiesto nepretržitej aktivity rytmicky "osciluje".

Bolo by však z nameranej aktivity mozgu možné spätne dekódovať, čo mozog práve analyzuje? Práve o to sa pokúsili vedci z Zuckermanovho inštitútu na Columbia University v New Yorku. Ich práca s názvom "Smerom k rekonštrukcii zrozumiteľnej reči z ľudskej sluchovej kôry mozgovej" vyšla v recenzovanom odbornom časopise Nature - Scientific Reports (PDF).

Než sa dostaneme k aktuálnej štúdii, pripomeňme si, že snaha vedcov "pozrieť sa ľuďom do mozgu" nie je nijako nová. Moderné metódy zahŕňajú už zmienenú funkčnú magnetickú rezonanciu alebo povrchové meranie elektrickej aktivity EEG.

Priamym predchodcom práve vydanej štúdie je práca publikovaná v ploche roku 2012 (PDF). Na meranie využila invazívne metódy: elektródy vložené operatívne priamo na povrch ľudského mozgu.

Vedcom sa vtedy podarilo analýzou elektrických signálov rozpoznať niektoré konkrétne slová pomocou vizuálnej rekonštrukcie na spektrograme.

Na štúdii z roku 2012 sa podieľal aj doktor Nima Mesgarani, ktorý viedol tím newyorských vedcov v aktuálnej štúdii. Tiež tentoraz využili vedci u piatich pacientov implantáty monitorujúce jemné elektrické signály na povrchu kôry mozgovej. Okrem toho pridali ďalšiu vrstvu - počítačovo simulovanú neurónovú sieť, teda strojové učenie.

Trénovanie simulovaného sluchu
"Aby sme posunuli hranice doteraz najlepších neuroprotéz, skombinovali sme súčasné pokroky v strojovom učení s pokrokom v syntéze reči," uvádzajú vedci v zhrnutí práce. "To nám umožňuje rekonštruovať zrozumiteľnú reč priamo z ľudskej sluchovej kôry mozgovej."

Piatim pacientom (ktorí mali pred sebou tak ako tak operáciu mozgu kvôli epilepsii) vedci do mozgu voperovali jemnú mriežku elektród. Potom pacienti počúvali 30 minút príbehov čítaných štyrmi rôznymi čitateľmi. Počas čítania museli pacienti počúvať, čo vedci náhodne kontrolovali náhodnými pauzami a otázkami.

Týchto tridsať minút slúžilo na nameranie toho, ako mozog poslucháčov reaguje na známe dáta, teda na známe slová. Na týchto dátach sa natrénovala umelá neurónová sieť kombinujúca rôzne zapojenia neurónov do vrstiev.

Potom pacienti počúvali, ako im niekto číta čísla od nuly do deviatky (tieto slová pritom neboli súčasťou trénovacích dát). Dáta namerané v mozgu pacientov potom vedci prehnali natrénovanou neurónovou sieťou. K prezentácii výsledkov nakoniec využili rôzne druhy syntetizátorov reči. Výsledkom je roboticky znejúci hlas, ktorý je síce miestami značne skreslený, ale celkovo zrozumiteľný.

"Ukázali sme, že ľudia týmto (syntetizovaným, pozn. red.) slovám rozumie v 75 percent prípadov, čo je viac, než v akomkoľvek predchádzajúcom pokuse," uvádza vedúca pokusu Mina Mesgarani. "Citlivý dekodér hlasu a mocné neurónové siete dokázali reprodukovať slová, ktoré pacienti počuli, s prekvapivou presnosťou."

Mesgaraniho tím plánuje do budúcnosti zložitejšie pokusy, vrátane rozpoznávania komplikovaných slovných spojení a celých viet. Cieľom je priblížiť sa porozumeniu toho, ako ľudský mozog reprezentuje a vníma reč. To by časom mohlo viesť k vývoju implantátu, ktorý by umožňoval previesť myšlienky na reč a uľahčiť tak život pacientom, ktorí kvôli chorobe alebo úrazu prišli o hlas.

Teraz komunikujú prostredníctvom zložitých zariadení a výberu slov z obrazovky. V budúcnosti by podľa Mesgaraniho bolo možné, aby bola reč syntetizovaná priamo signály z mozgu: "Bola by to revolúcia. Dalo by to týmto ľuďom nové spojenie so svetom."

Okrem toho by bolo takýto implantát zrejme možné použiť aj k ďalším diagnostickým účelom. A samozrejme tiež k svätému grálu všetkých dystopických sci-fi thrillerov: čítaniu myšlienok.