Si človek alebo počítač? Nová umelá inteligencia rozpozná zákerný text

Na rozdiel od človeka vie len jednu vec, ale práve tú, ktorá doteraz človeka od počítača odlišovala, informuje Technet.cz.

Čo robí človeka človekom? Filozofi, biológovia alebo psychológovia by na túto zložitú otázku určite vedeli odpovedať na tisíc spôsobov. Ale na internete sa rozdiel medzi automatizovaným robotom a užívateľom z mäsa a kostí tradične scvrkol na jednoduchú otázku: dokážeš prečítať pokrivený text? Ak áno, si človek, vstup povolený. Ak nie, padaj preč, robot.

Najprv stačil prakticky akýkoľvek text, a "človečenstvo" bolo overené. Lenže on-line roboti, respektíve pochopiteľne tí, ktorí ich programujú, postupne prichádzali s lepšími a lepšími spôsobmi, ako tzv. CAPTCHA obísť.

Programátori zodpovední za toto zabezpečenie tak museli text skresľovať stále viac, až nakoniec s jeho čitateľnosťou majú problémy aj ľudia. Našťastie existujú aj alternatívy, ktoré po ľuďoch opisovanie textu nevyžadujú, ale textové overovanie zatiaľ naďalej prevláda.

Inšpirovaný štruktúrou ľudského mozgu

Výskumníci z kalifornskej firmy Vicarious AI teraz ukázali nový spôsob počítačového čítania znakov. Ich neurónové siete, inšpirované stavbou ľudského mozgu, dokázali čítať skreslený znak s 94 percentnou úspešnosťou.

To v praxi znamená, že počítač prejde i tá najzložitejšia textová CAPTCHA zabezpečenia v dvoch prípadoch z troch. V minulosti pritom už len úspešnosť počítača v mnohých percentách indikovala, že je taký systém zabezpečenia deravý a zrelý na výmenu. Za zmienku stojí aj ľudská (ne)úspešnosť vypĺňania týchto CAPTCHA testov: ľudia sa netrafia v jednom zo štyroch pokusov (pri niektorých zložitých CAPTCHA je to ešte menej).

Princíp rekurzívnej kortikálnej siete (recursive Cortical Network - RCN) popísali výskumníci v článku, ktorý vyšiel v prestížnom vedeckom časopise Science (PDF). 

​Jedinečnosť nového prístupu spočíva v tom, akú malú vzorku znakov mala "kortikálna sieť" k dispozícii na svoje trénovanie. Zvyčajne sa neurónové siete učia na obrovskom množstve dát, napríklad na miliónoch alebo miliardách príkladov. Naproti tomu nová RCN len na niekoľkým stovkách.

"Predchádzajúce modely vyžadovali metódu hĺbkového učenia, kde sú neuróny (ide o počítačom simulované neuróny, teda akési rozhodovacie uzly, pozn. red.) A programátor ich trénuje k odpovedi podľa zadania," vysvetlil Dileep George, spoluzakladateľ laboratória Vicarioius. "Mohli by ste tak vytrénovať stroj k tomu, aby spoznal písmeno A skrátka tým, že mu ukážete stovky tisícov príkladov písmená A. Ale aj potom by mala taká sieť problém odlíšiť A od B napríklad tam, kde sa prekrývajú spôsobom, ktorý táto sieť nikdy predtým nevidela."

"Naopak dieťa nepotrebuje vidieť státisíce príkladov písmena A, aby sa naučilo čítať toto písmeno," hovorí George. Práve u toho, akým spôsobom vníma vizuálne informácie ľudský mozog, jeho tím začal. Ich kortikálna sieť si vytvorila vlastné "predstavy" o tom, čo robí písmeno A písmenom A - tvary, obrysy, krivky.

"Naším dlhodobým cieľom je vytvoriť umelú inteligenciu, ktorá funguje podobne ako ľudský mozog," uviedol George. Ich článok v Science napokon naznačil, že sieť RCN sa zdá byť použiteľná aj pre rozpoznávanie objektov v scéne (čo je typický problém, ktorý riešia firmy zaoberajúce sa strojovou analýzou obrazu). "CAPTCHA je len prirodzený spôsob, ako si otestovať, čo vieme. Je to test, ktorý zisťuje, či náš program funguje podobne ako ľudský mozog."

Ich algoritmus dokázal vyriešiť CAPTCHA kódy s vysokou úspešnosťou: 66,6 percenta pri reCAPTCHA, pri BotDetectu 64,4 percenta, pri Yahoo 57,4 percenta a pri kódoch PayPal dosiahol 57,1 percenta úspešnosti. To možno označiť za začiatok konca overovania CAPTCHA. Iste, je možné dodať do CAPTCHA novú zložitosť, ale vzhľadom na to, ako sa program Vicarious dokázal prispôsobiť rôznym metódam skresľovania, šumu a pokrivovania textu, možno predpokladať, že text, ktorý by pre neho bol nečitateľný, by robil neprekonateľné problémy aj ľuďom.