Blog

Iskoristite moć dubokog učenja uz IBM Watson Machine Learning

Lucija Jusup

Umjetna inteligencija starija je od Interneta, dok je sam termin “umjetna inteligencija” smišljen povodom ljetne istraživačke radionice koledža u Dartmouthu 1956. godine.  Od tada je umjetna inteligencija povremeno, ali uvijek upečatljivo dolazila u središte pažnje. U današnje vrijeme umjetnu inteligenciju koristimo svakodnevno, a gotovo da nema industrije u kojoj se umjetna inteligencija ne primjenjuje. Tu je uglavnom riječ o poslovnoj transformaciji poslovanja, unapređenju korisničkog iskustva i stvaranju inovacija. Umjetna inteligencija su najjednostavnije rečeno svi oni sustavi koji se, kako se to obično kaže, ponašaju na neki način slično čovjeku. Međutim, to ne znači da su ti sustavi samosvjesni ili da su slični ljudskoj inteligenciji; to samo znači da je sustav sposoban riješiti određeni problem.

Umjetna inteligencija nije tu da zamijeni čovjeka već da mu pomogne u donošenju informiranijih odluka i olakša mu izvršavanje određenih zadataka. Uz umjetnu inteligenciju vežu se pojmovi strojnog i dubokog učenja. Dio algoritama unutar umjetne inteligencije spada u strojno učenje, dok se problemima unutar strojnog učenja čija je dimenzionalnost puno veća bavi duboko učenje. Strojno učenje bavi se oblikovanjem algoritama koji svoju učinkovitost poboljšavaju na temelju empirijskih podataka te su, kako vrijeme prolazi, sposobni poboljšavati svoj rad.

Brzi rast dubokog učenja

Duboko učenje najbrže je rastuća potkategorija strojnog učenja koja koristeći neuronske mreže pokušava razviti sustav za prepoznavanje određenih uzoraka. Danas razne tvrtke koriste duboko učenje za razvoj snažnih algoritama koji obuhvaćaju područja računalnog vida, obrade prirodnog jezika, razumijevanja govora i zvučnih signala, bioinformatiku i mnoga druga danas aktualna područja. Jedna od najpoznatijih primjena dubokog učenja danas je prepoznavanje objekata na slikama. Primjerice, jedan od slučajeva korištenja je automatska kontrola nošenja zaštitne opreme na radnim mjestima koja to zahtijevaju, a u Megatrend poslovnim rješenjima razvili smo rješenje za automatsku detekciju zaštitne kacige i zaštitnog prsluka.

Slika 1. Primjer dubokog učenja – detekcija objekata na slikama

Svime navedenim bavi se znanost o podacima. Bitno je naglasiti da je znanost o podacima timski sport. Dakle, da biste napravili rješenje koje će krenuti od samog razvoja i završiti u fazi produkcije i stalnog poboljšavanja i usavršavanja produkta treba puno različitih vrsta znanja i sposobnosti. Sva ta znanja teško se mogu pronaći u jednoj osobi, zato je bitno sklopiti tim različitih profila ljudi s odgovarajućim sposobnostima. Počevši od podatkovnog inženjera, koji poznaje izvore podataka i koji će prikupljati podatke, obraditi ih i pripremiti za podatkovnog znanstvenika koji će dalje s tim podacima krenuti u izradu i treniranje modela, pa do poslovnog analitičara koji će znati dalje tumačiti rezultate modela i na kraju DevOps inženjera i razvojnog inženjera koji će omogućiti da se taj model stavi u produkciju ili uključi unutar aplikacije.

Slika 2. Primjer Data Science tima

Izazovi projekata dubokog učenja

Razvoj takvih rješenja donosi određene izazove kao što su instalacija i pokretanje sustava koji mogu trajati tjednima, odnosno mjesecima, što je, iako jednokratan, ipak veliki gubitak vremena. Kod dubokog učenja naglasak je na velikoj količini kvalitetnih podataka, a obrada i prikupljanje istih odnosi mnogo vremena. Zatim, treniranje i optimizacija modela strojnog i dubokog učenja također predstavljaju veliko računalno opterećenje i trošak vremenskih resursa. Ukoliko pronađemo rješenje za uštedu vremena u mogućnosti smo preraspodijeliti ga na neke druge korisne zadatke. IBM-ov alat Watson Machine Learning pomaže upravo u tome. To je platforma koja kreira okruženje sa svim potrebnim funkcionalnostima za razvoj modela dubokog učenja pomoću koje smo u mogućnosti u relativno kratkom vremenu razvijati brze i točne modele.

IBM Watson Machine Learning (WML) je enterprise-ready što znači da je dizajniran prema zahtjevima i potrebama enterprise tvrtki. Drugim riječima, uključen je sav potreban security, autentifikacija, autorizacija i ostalo što je potrebno da bi se što manje vremena trošilo na instalaciju i podešavanje a dobiva se okruženje spremno za rad prema svim standardima. Isto tako, na ovaj je način enterprise-ready AI okruženje po prvi put dostupno svima.

Bitno je naglasiti da je WML sagrađen od open source alata. Velika većina alata koje podatkovni znanstvenici koriste u izradi modela strojnog i dubokog učenja dolaze u open source varijanti, a jedna od prednosti toga je da je moguće početi raditi bez inicijalnog troška licenci. Usprkos tome, često je sjedinjavanje i podešavanje više open source alata zahtjevan posao gdje su moguće greške i utrošak vremena može biti značajan. Međutim, WML dolazi sa svim potrebnim alatima i najnovijim instaliranim verzijama spremnima za rad, te je usredotočen na pojednostavljivanje pristupa verzijama raznih okruženja koja se koriste kod strojnog i dubokog učenja.

Performanse IBM Watson Machine Learninga (WML-a)

Performanse WML-a koriste sve mogućnosti IBM Power arhitekture i posebno osmišljenih elemenata specifičnih za AI procese. Radi se o računalu koje je inicijalno dizajnirano da bi svoj maksimum dostizalo upravo radom s modelima strojnog i dubokog učenja, odnosno treniranju, izradi tih modela i svim ostalim procesima koji su potrebni da bi proces funkcionirao. To je arhitektura koja omogućava linearan rast sustava za strojno učenje bez poteškoća u performansama i bez potrebe redizajniranja sustava. Takve performanse omogućuju grafičke kartice. Bitno je naglasiti da se između GPU-a i CPU-a koristi NVLink koji ubrzava komunikaciju između grafičke kartice i procesora, a tako posložen sustav osim same brzine omogućava i korištenje velikih kompleksnih modela. To omogućava prelaženje granice memorije koju imaju grafičke kartice što pak znači korištenje puno većih modela i ukoliko se radi o prepoznavanju slika, korištenje slika velike rezolucije.

Većina modela koji se koriste za prepoznavanje slika radi na skupu podataka, odnosno slika, sa smanjenom rezolucijom, što je nekad dovoljno, međutim postoje slučajevi kada detalji odlučuju o preciznosti samog modela i tada se koriste slike veće rezolucije.

WML dolazi u dvije varijante, kao Community Edition, koji se u potpunosti temelji na open source tehnologiji te IBM Watson Machine Learning Accelerator koji ipak obuhvaća neke dodatne funkcionalnosti. WML dostupan je i kao dio platforme IBM Cloud Pak for Data. IBM Watson Machine Learning Accelerator uključuje razne IBM-ove alate za skaliranje i upravljanje sustavom. Uključeni su IBM Spectrum LSF (Load Sharing Facility), koji se sastoji od jednog od najbržih i najpouzdanijih HPC-a (High Performance Computing) na tržištu te IBM Spectrum Conductor – automatsko upravljanje procesima i optimizacija performansi i resursa. Također, uključuje i sljedeće tehničke komponente: multitenant arhitekturu, Elastic Distributed Training, koji omogućava dinamičku raspodjelu zadataka po resursima, paralelnu optimizaciju hiperparametara, vizualizacije tijekom procesa treniranja modela te skaliranje s jednog na više servera. IBM Watson Machine Learning Accelerator dolazi i sa SnapML paketom, koji omogućava veoma brzo treniranje modela strojnog učenja na GPU/CPU sustavima.

Slika 3. Glavne karakteristike IBM Watson Machine Learning Acceleratora

Zaključak

Ovom platformom IBM je stvorio rješenje koje omogućava i olakšava suradnju stručnjaka različitih područja umjetne inteligencije, a sve to uz naglasak na ubrzanju procesa i uštedi vremena. Možemo reći da je IBM Watson Machine Learning kompletno okruženje koje omogućuje jednostavno vođenje AI projekata i procesa od početka pa sve do kraja, odnosno produkcije.