Blog

Novosti i trendovi u svijetu umjetne inteligencije i znanosti o podacima

Lucija Jusup

U prošlom blog postu o novostima u svijetu umjetne inteligencije i znanosti o podacima pisali smo o Deepfakeu i DeepMindovoj Ithaci, alatu koji se na neki način bavi predviđanjem događaja u prošlosti. Ovoga puta ponovno ćemo se pozabaviti jednim alatom razvijenim od strane DeepMinda oko kojeg se trenutno vode polemike jesmo li na pragu razvijanja prvog sustava opće umjetne inteligencije. Da bismo razumjeli što opća umjetna inteligencija uopće predstavlja, za početak ćemo dati definicije i uvod o vrstama umjetne inteligencije.

Artificial Narrow Intelligence

Vjerujem da smo svi već vrlo dobro upoznati s pojmom i značenjem umjetne inteligencije (engl. Artificial Intelligence – AI). No postoji nekoliko vrsta umjetne inteligencije i vrlo vjerojatno kada kažemo umjetna inteligencija mislimo na onu najjednostavniju, slabu umjetnu inteligenciju (engl. Artificial Narrow Intelligence – ANI). ANI predstavlja sustave bazirane na AI-ju koje poznajemo danas i koji su specificirani za rješavanje jednog (tipa) problema ili za rješavanje nekoliko problema, ali iz iste domene i mogu izvoditi pojedinačne, automatizirane i ponavljajuće zadatke.

Dakle, specifično su napravljeni i naučeni za rješavanje određene vrste problema i ne trebaju imati opće kognitivne sposobnosti. Po definiciji, imaju sužene (engl. narrow) mogućnosti, poput preporuke sadržaja za korisnika nekakve e-platforme ili predviđanja prodaje određenih proizvoda. Ovo je jedina vrsta umjetne inteligencije koja danas postoji. Sustavi bazirani na tom tipu AI-ja mogu se približiti ljudskom funkcioniranju i razmišljanju u vrlo specifičnim kontekstima, pa čak i nadmašiti ih u mnogim slučajevima, ali se ističu samo u vrlo kontroliranim okruženjima s ograničenim skupom parametara.

Artificial General Intelligence

Opća umjetna inteligencija (engl. Artificial General Intelligence – AGI) je sposobnost inteligentnog agenta/sustava da razumije ili nauči bilo koji intelektualni zadatak koji može razumjeti i ljudsko biće. To je još uvijek samo teorijski koncept i primarni cilj nekih istraživanja umjetne inteligencije kao i uobičajena tema u znanstvenoj fantastici i studijama budućnosti. AGI se definira kao AI koji ima kognitivne funkcije na ljudskoj razini, u širokom rasponu domena kao što su obrada jezika, obrada slika, računalno funkcioniranje i razmišljanje itd. U teoriji, AGI sustav bi se trebao sastojati od tisuća i tisuća ANI sustava koji rade u timu međusobno komunicirajući kako bi oponašali ljudsko razmišljanje i djelovali sukladno tome. Jednostavnijim riječima, cilj AGI-ja je stvoriti strojeve koji bi bili sposobni razumjeti svijet istim kapacitetom kao svako ljudsko biće i na temelju tih vanjskih inputa imaju sposobnost otkriti rješenja za dani problem.

Međutim, čak i s najnaprednijim računalnim sustavima i infrastrukturama, kao što su Fujitsuov K ili IBM-ov Watson, trenutno je potrebno oko 40 minuta za simulaciju jedne sekunde neuronske aktivnosti. To govori o golemoj složenosti i međusobnoj povezanosti ljudskog mozga, ali i o veličini izazova izgradnje AGI-a s resursima koji su nam trenutno na raspolaganju.

Artificial Super Intelligence

Ovdje skoro ulazimo u teritorij znanstvene fantastike, ali umjetna superinteligencija (engl. Artificial Super Intelligence – ASI) smatra se logičnim napretkom i nastavkom AGI-ja. Sustav umjetne superinteligencije mogao bi nadmašiti sve ljudske sposobnosti. To bi uključivalo rješavanje problema u smislu donošenja racionalnih odluka, pa čak i stvari poput izrade bolje umjetnosti i izgradnje emocionalnih odnosa.

Nakon što postignemo opću umjetnu inteligenciju, sustavi umjetne inteligencije brzo bi mogli poboljšati svoje sposobnosti i napredovati u područja o kojima možda nismo ni sanjali. Iako bi jaz između AGI-ja i ASI-ja bio relativno uzak (neki kažu samo nanosekunda, jer bi tako brzo učila umjetna inteligencija), dugo putovanje koje je pred nama prema samom AGI-u čini da ovo djeluje kao koncept koji leži daleko u budućnosti.

Slika 1. Sažetak i opis funkcionalnosti koje su obuhvaćene u svakoj od vrsta umjetne inteligencije

Gato

U radu objavljenom u svibnju ove godine DeepMind je predstavio model Gato koji je bliže AGI-ju nego sve što je dosad napravljeno i viđeno. Gato može naučiti igrati Atari igre, generirati realističan tekst, obrađivati slike, slagati raznobojne blokove pomoću robotske ruke i još mnogo toga. Gato je u mogućnosti obavljati više od 600 različitih zadataka, a sve s istom neuronskom mrežom s istim težinama.

Arhitektura Gato-a ne razlikuje se toliko od arhitekture mnogih AI sustava koji se danas koriste. Iako u DeepMindovom radu u kojem je predstavljen Gato nije vrlo detaljno opisana arhitektura, jasno je da je temeljena na transformerima koji se koriste za obradu prirodnog jezika i generiranje teksta. Više o transformerima i njihovoj arhitekturi možete pročitati na jednom od naših prošlih blog postova. Inspiriran velikim jezičnim modelima, DeepMind je primijenio sličan pristup, ali je proširio područje svog djelovanja izvan područja tekstualnih izlaza. Gato radi kao multimodalna, multi-task, multi-utjelovljena mreža, što znači da ista mreža (tj. jedna arhitektura s jednim skupom težina) može obavljati veliku količinu različitih zadataka, unatoč tome što uključuje inherentno različite vrste ulaza i izlaza.

Dizajn Gato-a temelji se na principu treniranja na najširem mogućem rasponu relevantnih podataka kao što su slike, tekst, propriocepcija, zakretni momenti zglobova, pritisci na gumbe i druga diskretna i kontinuirana opažanja i radnje. Za simulirane kontrolne zadatke, Gato je treniran na skupovima podataka koje generiraju state-of-the-art agenti ojačanog učenja (engl. reinforcement learning) trenirani na nizu različitih okruženja. Što se tiče vizualnih i tekstualnih podataka, Gato je treniran na MassiveText skupu podataka, zbirci velikih tekstualnih skupova podataka na engleskom jeziku iz različitih izvora: web stranice, knjige, novinski članci i programski kod. Uključeno je i nekoliko skupova podataka koji su kombinacija tekstualnih i vizualnih podataka, kao što je ALIGN, koji se sastoji od 1.8 milijardi slika s alt text anotacijom koji se koriste unutar HTML koda za opisivanje izgleda i funkcije određene slike.

K tome, poprilično je impresivan podatak da Gato svojom veličinom nije ni blizu najvećih velikih neuronskih mreža koje smo do sada vidjeli. Sa svojih 1.2 milijardi parametara, možemo ga usporediti s jezičnim modelom GPT-2 kojeg je stvorio OpenAI 2019. godine i čak je 2 reda veličine manji od njihovog modela GPT-3.

Trenutno su mišljenja stručnjaka oko toga je li Gato uistinu prvi, primitivni predstavnik AGI-ja podijeljena. Jedan od autora Gato-a, Nando de Freitas, na Twitteru je iznio mišljenje kako stvaranje opće umjetne inteligencije više nije znanstvena fantastika, već je moguće umjetnu inteligenciju učiniti većom i učinkovitijom, samo joj treba dati dovoljno podataka. S druge strane, Gary Marcus iz američke tvrtke Robust.AI, smatra kako situacija nije baš tako jednostavna kako bi na prvi pogled mogla izgledati i kako je Gato naučio raditi svaki od svojih zadataka, no kad se susretne s novim izazovima, neće ih moći logički analizirati i riješiti.

Dok među stručnjacima traju rasprave oko toga svjedočimo li stvaranju prvog AGI-ja, većina se slaže da potencijal Gato-a nije upitan, ali nam ostaje za vidjeti je li to uistinu preteča opće umjetne inteligencije i odskočna daska za razvoj AGI-ja ili samo još jedan od ANI modela treniran na vrlo raznovrsnom skupu podataka.

Literatura:

  1. https://www.deepmind.com/publications/a-generalist-agent
  2. https://towardsdatascience.com/gato-the-latest-from-deepmind-towards-true-ai-1ac06e1d18cd
  3. https://en.wikipedia.org/wiki/Artificial_general_intelligence
  4. https://en.wikipedia.org/wiki/Superintelligence