Strojové učenie je alchýmia, upozorňujú odborníci v oblasti AI

Povedal, že počítačové algoritmy, v ktorých sa počítače učia prostredníctvom pokusov a omylov, sa stali formou "alchýmie", píše magazín Science.

Výskumníci podľa neho nevedia, prečo niektoré algoritmy fungujú a iné nie, ani nemajú prísne kritériá pre výber jednej architektúry AI nad inou. V apríli na Medzinárodnej konferencii o vzdelávacích zastúpeniach vo Vancouveri v Kanad, Rahimi a jeho spolupracovníci dokumentujú príklady toho, čo považujú za problém alchymie a ponúkajú predpisy na posilnenie rigoróznosti AI. "Mnohí z nás majú pocit, že pracujeme na cudzej technológii."

Problém je odlišný od problému reprodukovateľnosti AI, pri ktorom vedci nemôžu reprodukovať výsledky druhej strany z dôvodu nekonzistentných experimentálnych a publikačných postupov. 

Bez hlbokého pochopenia základných nástrojov potrebných na budovanie a trénovanie nových algoritmov  výskumníci, ktorí vytvárajú AI, sa uchýlia k chýrom ako stredovekí alchymisti. "Ľudia sa spoliehajú na folklór a kúzla," dodáva François Chollet, počítačový vedec spoločnosti Google v Mountain View v Kalifornii.

Vedci AI, ktorí trénujú svoje algoritmy, jednoducho tápu v tme. Napríklad, implementujú takzvaný "stochastický gradientný zostup", aby optimalizovali parametre algoritmu pre najnižšiu možnú poruchovosť. Napriek tisíckam akademických článkov o tejto téme a nespočetných spôsoboch použitia metódy sa proces stále opiera o pokusy a omyly.

Rahimiho práca zdôrazňuje zbytočné úsilie a neoptimálny výkon, ktorý z toho môže vyplynúť. Napríklad keď iní vedci odobrali väčšinu zložitosti z najmodernejšieho algoritmu prekladania jazykov, v skutočnosti  lepšie a efektívnejšie prekladal z angličtiny do nemčiny alebo francúzštiny, čo dokazuje, že jeho tvorcovia nedokázali úplne pochopiť, prečo boli tieto extra časti dobré. 

Rahimi ponúka niekoľko návrhov na učenie, ktorými algoritmy fungujú najlepšie a kedy. Predpokladá sa, že vedci by mali robiť "ablačné štúdie", ako sú tie, ktoré sa robia s prekladovým algoritmom - vymazanie častí algoritmu jeden po druhom, aby sa zobrazila funkcia každej zložky. Vyzýva k "rozdelenej analýze", v ktorej je podrobne analyzovaný výkon algoritmu, aby zistil, ako by zlepšovanie v niektorých oblastiach mohlo mať prínos inde. 

"Fyzici sú úžasní pri navrhovaní jednoduchých experimentov, aby vysvetlili vysvetlenie javov," hovorí Ben Recht, počítačový vedec na Kalifornskej univerzite v Berkeley a spoluautor Rahimiho štúdie. Niektorí vedci AI už preberajú tento prístup, skúšajú algoritmy rozpoznávania obrázkov na malých čiernych a bielych rukopisných znakoch predtým, ako riešia veľké farebné fotografie, aby lepšie porozumeli vnútornej mechanike algoritmov.