Blog

Plodovi povećavanja sustava

Lovre Pešut

U našem prošlom blogu (klikni ovdje) pričali smo o novoj eri umjetne inteligencije, modelu generiranja slika i eksponencijalnom rastu istog.
Važno je napomenuti da naš napredak u, recimo, modelima generiranja slika, nije prvenstveno rezultat nekih dubokih uvida u prirodu generiranja slika koje smo u zadnjim godinama izvukli, a koje smo zatim ugradili u naše modele.

Da, smislili smo neke nove modele koji su radili nešto bolje od starih modela, ali većinom su se ti napredci sastojali od opskrbljivanja modela dubokog učenja golemim količinama podataka — npr. parovima teksta i slika — iz kojih je model trebao “sam” izvući bit vizualne konstitucije svijeta.

U drugim domenama su se dogodile slične stvari. Veliki napredak u obradi prirodnog jezika, primjerice uspjeh “GPT” serije modela, nije došao iz dubokog promišljanja o prirodi jezika i ugrađivanja te prirode u stroj.
Umjesto toga došao je iz ubacivanja velikih količina teksta u stroj, u nadi da će stroj – pod kojim mislimo na model dubokog učenja uparen s nečim poput stohastičkog gradijentnog spusta – razviti vlastitu intuiciju za jezik. I jest!

Ovaj trend sugerira da razvoj umjetne inteligencije ne mora biti usko vezan uz naše “razumijevanje inteligencije” ili bilo koje druge misteriozne stvari. Mogao bi, umjesto toga, biti slučaj da ćemo sa sve većom računalnom moći dobiti sve veću inteligenciju, i to će biti to.

U zadnje vrijeme modeli također postaju sve bolji i bolji u stvarima koje smatramo prilično teškim intelektualnim izazovima — postaju sve bolji u programiranju i, polako, u matematici.
DeepMindov Alphacode, model koji piše kôd, nadmašio je 54% drugih programera u jednom programerskom natjecanju. Minerva, jezični model naučen rješavati matematičke probleme, točno je riješio 50,3% skupa zadataka MATH, koji se pretežito sastoji od problema na razini srednjoškolskih natjecanja.

Naravno, još uvijek postoji mnogo intelektualnih zadataka koje ovi modeli ne mogu napraviti, u ovom sadašnjem trenutku. Ali s tako brzim napretkom u posljednjih 10 godina, tko može biti siguran što to neće moći učiniti za sljedećih 10?

Upravo u sljedećem blogu pričat ćemo o budućnosti umjetne inteligencije…

*Image by Freepik