12.3 C
Ljubljana
sobota, 5 oktobra, 2024

(INTERVJU) Dr. Boštjan Kaluža: »Smo v prelomnem obdobju, ki bo bistveno vplivalo na to, kakšne bodo nove storitve v prihodnje«

Piše: Lucija Kavčič

Umetna inteligenca je z nami že dolgo, vendar je v zadnjih dveh letih prišlo do velikega preskoka, saj je postala naš sogovorec in nam lahko odgovarja v prostem besedilu, v zvoku, slikah in videih, zato bo močno spremenila poslovne modele, je v pogovoru za našo revijo dejal dr. Boštjan Kaluža, strokovnjak za umetno inteligenco, ki se pri svojem delu sicer osredotoča na analizo podatkov in odkrivanje sumljivega vedenja.

Za začetek vas prosim, da poveste nekaj o smeri vaših raziskav in o področju, s katerim se ukvarjate. Za kaj gre?

Že pred časom sem doktoriral s področja umetne inteligence, natančneje s področja detekcije sumljivih in nenavadnih vzorcev. Gre za to, da pri sumljivih vzorcih vemo, kakšne stvari nam niso všeč, in te potem iščemo. Sumljivi vzorci so na primer: ko analiziramo promet med računalniki in ko pride do kakšnega kibernetskega napada, vemo, kakšni so recimo vzorci takih napadov, kjer napadalci skušajo dostopati do zunanjih vrat. V doktoratu sem se ukvarjal z detekcijo sumljivih vzorcev potnikov na letališču. To pomeni, če nekdo stoji v vrsti in ne zahteva storitve, če se izogiba varnostnikom in podobno. Ali pa, ko več dni spremljamo obnašanje starejših ljudi, ki so sami doma, lahko zaznamo bistveno poslabšanje zdravja: če jih je prizadela kap ali če ponoči pogosteje hodijo na stranišče ali kaj podobnega. Torej tako najdemo določene vzorce vedenja, za katere vemo, da niso dobri, medtem ko je pri nenavadnih vzorcih drugače − ne vemo točno, kaj iščemo. Vemo, kako je videti običajno obnašanje, kar ni običajno, pa označimo za nenavadno. Gre torej za dva pristopa: v enem tarčno iščemo stvari, za katere vemo, da niso dobre, v drugem pa vemo, katere so dobre, vse, kar ne sodi zraven, pa označimo za nenavadno. In to je mogoče aplicirati na zelo zelo veliko različnih domen.

Umetna inteligenca v tej obliki, kot je v uporabi v zadnjem času, je bila še pred nedavnim znanstvena fantastika. Kako hitro se razvija in na katerih področjih je uporabna?

Umetna inteligenca je z nami že dolgo časa. V Sloveniji bomo zdaj praznovali petdesetletnico Slovenskega društva za umetno inteligenco (SLAIS), kar je kar dolga doba. Umetna inteligenca torej ni čisto nova stvar, se je pa zadnjih dveh letih zgodila bistvena sprememba. Če si predstavljate umetno inteligenco kot sogovorca, je do zdaj znana umetna inteligenca odgovarjala v številkah, če si jo npr. vprašal, kakšna je temperatura zunaj. Znala je odgovoriti na vprašanja z »da« ali »ne«: »ali je to spam ali običajna pošta?«. Znala je, npr., če si predstavljate vprašalnik, izbrati eno od mogočih variant abecede pred odgovori. Znala je ločevati npr., ali je na sliki mačka ali pes. Če pravilnega odgovora ni bilo na seznamu, se je umetna inteligenca zmotila, ker je pač znala le obkrožiti po eno možnost s seznama. Zdaj pa je umetna inteligenca naenkrat dobila sposobnost, da lahko odgovarja s prostim besedilom, kar je zelo velik preskok. Zdaj torej umetna inteligenca odgovarja v jeziku, ki ga ljudje govorimo in razumemo. To je revolucija na tem področju.

Na področjih je v uporabi že sedaj?

Umetna inteligenca je v uporabi že desetletja. Vsak dan jo uporabljate, ko imate »autocomplete« na telefonu ali pa Google Maps, ki pove, kam morate zaviti. Ampak to so spet vprašanja. Recimo Google Maps neštetokrat vpraša, kam zavijem − levo, desno, naravnost? −, in prava je  ena od treh možnosti, ki se ponovi na vsakem križišču. Zdaj, ko pa zna umetna inteligenca odgovarjati v celih odstavkih, pa je kar naenkrat lahko postala zelo učinkovit pomočnik. Lahko npr. pomaga pri brainstormingu ali naredi neke osnutke, zelo je uporabna pri povzemanju rezultatov ali analiz. Zelo popularen primer je Zoom: umetna inteligenca posluša, kaj se udeleženci pogovarjajo, in na koncu pripravi prepis celotnega pogovora, lahko pripravi povzetek, ključne besede, povzame ključne teme, in če je to poslovni sestanek, zapiše, kakšni so načrti aktivnosti za naslednjič, ter vse skupaj spravi na eno stran A4. Človeku to delo vzame uro ali dve, umetna inteligenca, kot je Chatbot, pa za to porabi dve sekundi in omogoči ljudem, da se bolj osredotočijo na izvajanje načrtov oziroma počnejo druge stvari.

Je umetna inteligenca zanesljiva, ničesar ne izpusti, se ne zmoti?

Napredek na tem področju je tako neverjetno hiter, da nekateri moji  sodelavci rečejo, da so npr. našli neki znanstveni članek iz starih časov, in pri tem mislijo na čas pred dvema letoma. Primer: novembra 2022 je izšla prva verzija ChatGPT, ki je bila dostopna javnosti. Marca 2023 je bila dostopna širši javnosti. Sedaj imamo že verzijo ChatGPT4. Napredek, bliskovit skok naprej, se zgodi vsake 3 do 6 mesecev. Tako da tudi, če pred recimo 6 meseci nekaj ni delalo v redu, danes lahko dela že brez napak, kajne? Zelo veliko je bizarnih primerov kot npr., da so ChatGPT vprašali, koliko črk »r« je v besedi strawberry. Prejšnje verzije so se zelo mučile s tem in trdile, da sta dva. Nova verzija seveda nima težav in pove, da so trije. Nova verzija torej lahko kar naenkrat razmišlja in rešuje zahtevnejše naloge. Seveda pa to ne pomeni, da je umetna inteligenca zdaj brezhibna ali popolnoma zanesljiva. Hitrost razvoja seveda prinaša tveganje nepreizkušenih rešitev, ki so lahko v praksi še vedno problematične.

In kje se to pozna v vsakdanjem življenju? Primer: umetna inteligenca, razvita za pomoč programerjem, se imenuje GitHub Copilot. Na začetku je med programerji naletel na zelo velik odpor: »To ne bo delalo, to ni zanesljivo, je brez zveze.« Ko so ga programerji osvojili, se je izkazalo, da poveča produktivnost programerjev za 25 do 30 odstotkov, ker je zelo veliko! Gre zelo velik preskok in programerji si zdaj, po enem letu uporabe, ne predstavljajo več dela brez njega. Če bi ga opustili, bi bil to približno tak korak nazaj, kot če bi šli z worda nazaj na tipkalni stroj – ko narediš eno napako, gre cela stran v smeti.

Boštjan Kaluža (Foto: Polona Avanzo)

Se tako napredna umetna inteligenca že uporablja na primer v medicini?

Seveda. V medicini se zelo veliko uporablja za pomoč pri diagnosticiranju, za iskanje anomalij z analizo slik in predvsem za iskanje po množici podatkov. V medicini je veliko člankov, veliko vsebin, veliko primerov in za enega človeka skoraj nemogoče, da bi vse to obvladal. Umetna inteligenca pa lahko pomaga prebiti se skozi vse te raziskave, izbrskati in poiskati tisto, kar nekdo potrebuje, tudi stvari, ki so bolj obskurne, bolj redke. Rezultati tudi kažejo, da je v marsikaterem primeru diagnosticiranje z umetno inteligenco lahko bolj zanesljivo kot tisto, ki ga opravi zdravnik. Seveda pa umetna inteligenca ne more biti prepuščena sama sebi, da bi določala potek zdravljenja. Lahko naredi napake ali prezre pomembne vidike diagnoze, kar lahko vodi do napačnih odločitev, če ni ustreznega človeškega nadzora. Zagovarjam seveda, da mora umetna inteligenca vedno delati v sodelovanju s človekom in da mora biti človek tisti, ki na koncu sprejme odgovornost, saj to ne more biti prepuščeno stroju, kar umetna inteligenca je.

Kaj pa recimo umetna inteligenca v vojaške namene? V Evropi se zdaj dogaja vojna, v kateri vsak dan uporabijo kakšno novo orožje, tehnologijo, če le morejo …

To je zelo kontroverzno in problematično področje. Tako kot vsaka stvar se tudi umetna inteligenca lahko uporabi v vojne namene in se tudi uporablja. Sprejema pa se zakonodaja, ki naj bi določene stvari prepovedovala in določala, kaj se sme uporabljati in česa ne. Vendar seveda države niso vse pristopile k sporazumom in to je težava. Avtonomna orožja so zelo problematična, vendar mora biti človek na koncu še vedno tisti, ki sprejme odločitev. Žal pa ni tehnološke ovire, da orožja ne bi vsega sama izvedla. Problem vojne je prav v tem, ker se v njej običajno najbolj krši zakonodaja, zato je to lahko zelo problematično.

Tudi fotografije in posnetki, imenovani deep fake, so povezani z umetno inteligenco. Kako je mogoče ugotoviti, da z neko fotografijo ali posnetkom nekaj ni v redu?

Umetna inteligenca na naša vprašanja ni sposobna odgovarjati samo v stavkih ali odstavkih, pač pa odgovarja tudi v zvoku, v videu ali pa v slikah. Ko enkrat odpremo možnosti  − taki umetni inteligenci pravimo generativna umetna inteligenca −, lahko umetna inteligenca generira nove vsebine iz podatkov, ki jih ima na razpolago. Napredek je tako hiter, da razločevanje, kaj je izvirnik in kaj produkt umetne inteligence, postaja problematično. Recimo še pred šestimi do dvanajstimi meseci je bilo zelo očitno, če je bila slika generirana z generativno umetno inteligenco: ljudje so imeli po šest prstov na rokah, po dve ušesi na vsaki strani glave, vsako oko drugačne barve, tudi osvetlitev je bila nenavadna. Če je tako fotografijo pogledal profesionalni fotograf, je lahko opazil, da nekaj ni v redu. Danes se tega ne da več opaziti oziroma je zelo težko. Zadostuje le nekaj sekund glasu in ena fotografija in generativna umetna inteligenca lahko ustvari cel video.

To je kar malo strašljivo …

Ja, po domače povedano, lahko vsak mulec, ki ima dostop do interneta, to naredi. Potrebnega je zelo malo tehničnega znanja, ni treba biti računalnikar. Zato si mediji prizadevajo, da bi bil pri vsaki fotografiji ali videu, ki bi bil narejen z umetno inteligenco, zraven napis, da je bilo to narejeno z umetno inteligenco. Seveda za uradne medije in podobno to označevanje lahko funkcionira, za vse zasebne račune in zasebno deljenje po spletu pa seveda ni mogoč noben nadzor, ki bi to reguliral. Detekcija takih fotografij in videov postaja problematična. Nazadnje smo imeli tak preskok, ko se je pojavil fotoshop in smo se spraševali, ali je fotografija prava ali jo je nekdo profesionalno popravil. Če je kdo res izurjen opazovalec, lahko najde nekaj nepravilnosti. Zdaj pa je to veliko veliko teže.

Kaj vse lahko prinese tak napredek? Kakšne prednosti lahko ima umetna inteligenca?

Umetna inteligenca bo lahko na primer popolnoma spremenila poslovne modele. Kaj to pomeni? Če bi npr. ta intervju dali umetni inteligenci, bo naredila njegov prepis in na podlagi tega lahko ustvari video dveh ljudi, ki se pogovarjata. Lahko npr. naročimo Chatbotu, naj naredi scenarij in v dveh letih bo iz tega scenarija lahko generiral holivudski film. To pomeni čisto nove poslovne modele za npr. Netflix, ki bo nove epizode kakšne filmske serije  s popolnoma novo vsebino lahko generiral samo za vas. In to glede na to, kakšne filme imate radi, kakšne zaplete, kakšne značaje, kakšen humor … Tako boste vi gledali drugačne epizode filmske serije kot morda jaz.

Kako pa se lahko na primer znan človek, igralec, poslovnež ali politik zavaruje pred tem, da ne bi nekdo ustvaril nekega videa z govorom oz. besedami, ki jih ni nikoli izrekel?

Težko. Mislim pa, da problem ni nič drugačen, kakor če recimo nekdo danes objavi besedilo in sliko fotoshop ter trdi, da je ta oseba izrekla te in te besede. Imamo samo nekaj težav več. Prvič je distribucija vsebin postala precej cenejša. Recimo prej, ko so imele možnost distribucije vsebin in dostop do publike samo medijske hiše, časopisne, radijske in televizijske, je bilo to neko sito, kjer so se lahko take informacije filtrirale. Danes pa ima vsak dostop do interneta in lahko objavi, karkoli hoče: najprej je lahko objavil tekst na spletni strani, danes pa lahko generira video in ga širi po tik-toku ali drugih modernih socialnih omrežjih. Sama mehanika je enaka, tudi mehanika zaščite je enako (ne)učinkovita, kar se je spremenilo, je samo format vsebin, ki jih je mogoče generirati.

Veliko aplikacij umetne inteligence si je mogoče naložiti na telefon, so pa plačljive. Je plačljivost lahko tudi ena od možnosti zaščite pred nenadzorovanim širjenjem z UI generiranih ponaredkov?

Se bojim, da ne. Ta čas generativna umetna inteligenca zahteva zelo veliko računske moči, in sicer moči grafičnih kartic (ki jih imajo otroci za igranje igric). Ampak cena teh storitev umetne inteligence neverjetno pada; od novembra 2022, ko je prišel ChatGPT ven, in do zdaj, dve leti kasneje, je cena padla že vsaj za desetkrat. In pričakovati je, da bo cena še padala, tako da bo ta storitev še bolj na voljo in še bolj dostopna. Apple je imel pred enim tednom dogodek, na katerem je predstavil Apple Intelligence in to, kako so te storitve vgrajene v telefon, kako v vse mogoče aplikacije: od avtomatske transkripcije do avtomatskih prevodov telefonskih pogovorov in avtomatskih povzetkov. Kar naenkrat bo to neopazno vgrajeno v naša življenja, cena pa bo še bolj padala. Po drugi strani se bodo še povečale možnosti za zlorabo.

Na kakšen način?

Zelo žgoča dilema je povezana s tem, da je umetna inteligenca sposobna odgovarjati v celih stavkih in sposobna govoriti naš jezik. In obstaja bojazen, da nikomur, ki ima sredstva in motivacijo, ni mogoče preprečiti, da ne bi uporabil več takšnih ChatBotov in z njimi oblikoval javnega mnenja tako, da bi generiral članke in različne vsebine. Približno tako kot je, kot nekateri trdijo, Rusija to že počela pri zadnjih ameriških volitvah. Tako je dejansko mogoče vplivati na javno mnenje v neki državi,  ChatBot lahko tudi na primer preprosto avtomatsko piše neke pravne dopise in jih pošilja na ustavno sodišče. In če si prej potreboval kopico odvetnikov, da si lahko nekaj takega dosegel, boš to danes lahko naredil le z motivacijo in z nekaj takimi orodji.

Kakšne bodo posledice vsega tega? Kako bo to spremenilo družbo, kako bo vse to vplivalo na ljudi?

To bo zelo pomemben preskok. Že ko so izumili računalnik, si najprej niso predstavljali, kaj bo vse to pomenilo. Računalniki so npr. bistveno pocenili računsko operacijo. Med prvo svetovno vojno so recimo imeli cele sobe ljudi, ki so računali trajektorije za balistiko. Po drugi svetovni vojni so pa kar naenkrat, ko so izumili računalnike na letalih, napredovali; vojna je gnala izume za razbijanje kriptirane komunikacije in enigem. Če ste slišali zgodbo Enigma … Do danes je cena računske operacije padla do take mere, da imamo zdaj digitalne fotoaparate. Pred tem si nismo predstavljali,  da si bomo fotografije in dokumente izmenjavali v elektronski obliki. Z umetno inteligenco se pa dogaja, da zdaj cena odločitve pada nekako tako naglo, kot je nekoč padala cena računske operacije. In to pomeni, da se bo način delovanja družbe lahko bistveno spremenil in se bodo pojavile nove storitve, ki si jih ta trenutek sploh še ne predstavljamo. Podobno kot je bilo s pojavom interneta, ki si ga je bilo težko predstavljati npr. leta 1950, je zdaj z umetno inteligenco. Smo v prelomnem obdobju, ki bo bistveno vplivalo na to, kakšne bodo nove storitve v prihodnje.

Prejšnji teden je bilo predavanje Ali lahko podjetje z enim zaposlenim postane milijardno podjetje? Zdaj je še malo zgodaj za to, vendar bo v nekaj letih lahko ključne funkcije v podjetju opravljal agent umetne inteligence kot ChatBot, ki lahko piše, bere, izvaja akcije, pošilja maile, opravlja telefonske klice, človek pa ga bo samo usmerjal. Spremembe bodo velike in hitre. Vendar vseeno mislim, da nam umetna inteligenca ne bo vzela službe, ampak se bo naredila razlika med tistimi, ki v svoji službi uporabljajo umetno inteligenco, in tistimi, ki je ne. Tako se bosta oblikovala dva različna svetova.

To je slišati precej vesoljsko. V kolikem času se lahko to zgodi?

Zelo hitro, v nekaj letih.

Predvsem med šolarji je Chat GPT zelo popularen za obnove knjig in seminarske naloge, ker nihče več noče brati. Kako se je treba spopasti s tem?

Tega nima smisla preprečevati, treba je spremeniti način. Naj učenci uporabijo ChatGPT, naloga pa je poiskati napake v odgovorih in presoditi, kako kvalitetno je besedilo, ki so ga dobili iz ChatGPT: je z njim kaj narobe in ali v njem manjka vsebina. Ko sem bil jaz otrok, se spomnim, da smo delali seminarske naloge tako, da smo šli v knjižnico. Ko sem prišel v srednjo šolo, se je že pojavila Wikipedija in velika debata, ali se sme Wikipedija uporabiti kot vir ali ne. In nekateri učitelji so že tedaj rekli – obišči Wikipedijo in kritično presodi, katere informacije so tam, ali kaj manjka in se jo nauči uporabljati kot orodje. Zato mislim, da je šolarje treba naučiti uporabljati ChatGPT kot orodje. Seveda obstaja nevarnost, da šolarji morda ne bodo razvili kritičnega mišljenja, če se bodo preveč zanašali na umetno inteligenco za naloge, kot so seminarske naloge in obnove knjig. Potreben je torej uravnotežen pristop, kjer bi šolarji še vedno morali sami razmišljati in uporabljati kreativne veščine.

Stvar, ki jo bo umetna inteligenca bistveno spremenila, je po moje izobraževanje. ChatBot ti namreč lahko na tvojem nivoju in s tvojim tempom pomaga razložiti neko vsebino. Naslednja stopnja bo lahko ChatGPT avatar kot učitelj,  poučevanje bo potekalo v naravnem pogovoru in tak učitelj bo učencu prilagajal težavnost, skrbel za motivacijo, iskal zanimive vsebine.

Kaj potem lahko ponudi učitelj, česar ne more ponuditi umetna inteligenca?

Dobro vprašanje: še vedno je človeška toplina nekaj, česar ni mogoče dobiti pri interakciji z zaslonom.

Ali bo branje primarnih virov oz. knjig nasploh sploh še relevantno? Kakšna je prihodnost tiskane literature? Veliko knjig je najbrž tako ali  tako že v bazi.

Umetna inteligenca bo posrkala skoraj vse tiskano digitalno gradivo, ki ga imamo, vključno s celotnim internetom, vse skenirane knjige, forume, pač vse, kar se na internetu najde. Ena od omejitev za naslednji preskok je, da je zmanjkalo vsebin. Za naslednje modele umetne inteligence bo pomembno poiskati nove vire podatkov. Kaj se bo zgodilo s tiskano knjigo, ne vem. Osebno imam rad tiskane knjige in jih rad berem tako, da jih vzamem roke. Za osnovno iskanje informacij in hitro razumevanje pa največkrat uporabljam orodje, kot sta ChatBot ali Google.

Kaj pa, če zmanjka elektrike? Ali potem ni več umetne inteligence? Bi energija lahko bila problem?

Drži. Modeli so vse večji in vse bolj zmogljivi, potrebujejo tudi več računske moči, kar seveda pomeni tudi več energije. Zato nekateri ocenjujejo, da bo dominanca v umetni inteligenci odvisna od tega, kako se bodo razvijale velesile v energetskem smislu. Energetsko precej prednjači Kitajska, ki ima veliko več novih jedrskih reaktorjev v primerjavi z Ameriko, ta pa ima ta čas najboljše modele, nima pa načrtovanih tako velikih zmogljivosti za povečanje energije v prihodnje. Prav energija bi lahko v naslednjih desetih, petnajstih letih igrala pomembno vlogo pri razvoju novejših in močnejših modelov umetne inteligence. Zelo veliko je tudi debat o geopolitičnem in geostrateškem načrtovanju umetne inteligence. Nikakor ne želimo, da bi imela samo ena država absolutni primat, ker morda ne bo demokratična. Zato si želimo, da se centri umetne inteligence razvijajo enakomerno, da ne pride do absolutne premoči. Podobno, kot je z atomskim orožjem.  Če bi neka država dosegla absolutno premoč na področju umetne inteligence, bi lahko imela bolj napredna orožja in bi s pomočjo umetne inteligence lahko izumila nove stvari precej hitreje kot preostale države, obdržala monopol in nadzirala druge. Ta čas umetno inteligenco sicer sočasno razvija več držav. Najmočnejše so sicer Združene države, Kitajska, tudi Evropa je precej napredna. Bo pa v prihodnje zelo odvisna od dostopa do podatkov, regulative in razpoložljive energije.

Kaj bi želeli v zvezi z umetno inteligenco še poudariti?

Sklenil bi, da umetna inteligenca predstavlja precej tveganj, ampak tudi precej priložnosti. In podobno, kot so avtomobili ali računalniki spremenili svet, ga bo spremenila tudi umetna inteligenca. Ključno pa je, da nas, ljudi, ne bo nadomestila, ampak da bomo delali skupaj z njo in bili zaradi tega učinkovitejši na področjih, ki jih umetna inteligenca ne bo pokrivala.

Bomo torej zaradi nje prej poleteli v vesolje odkrivat novo Zemljo?

Neposredno zaradi same umetne inteligence sicer ne, bo pa umetna inteligenca pospešila nove raziskave, zaradi katerih bomo hitrejši tudi na tem področju.

Že danes je pospešila raziskave na področju mikrobiologije in za odkrivanje novih zdravil, saj omogoča na tisoče poskusov. S pomočjo umetne inteligence se lahko napove, kakšen bi lahko bil učinek neke sestavine. In če primerjamo vse to s preteklimi leti, vidimo, da se je hitrost raziskav pospešila za tisočkrat. Če torej lahko za tisočkrat pospešimo raziskave za raziskovanje vesolja, bo tudi na tem področju napredek precej hitrejši in nova Zemlja morda bliže.

Biografija

Dr. Boštjan Kaluža (1984) je doktoriral na Mednarodni podiplomski šoli Jožefa Stefana v Ljubljani, kjer je zagovarjal doktorsko disertacijo z naslovom Detection of Anomalous and Suspicious Behavior Patterns. Danes je glavni podatkovni znanstvenik v ameriškem podjetju Evolven, pred tem pa je deloval kot višji raziskovalec na Oddelku za inteligentne sisteme na Institutu Jožef Stefan in vodil raziskovalne projekte, ki vključujejo odkrivanje vzorcev in anomalij, strojno učenje in napovedno analitiko. Poleg tega raziskuje umetno inteligenco in inteligentne sisteme ter se osredotoča na odkrivanje sumljivega vedenja in analizo podatkov. Objavil je številne članke v strokovnih revijah in predaval na konferencah. Je avtor knjig Instant Weka How-to (2013), Practical Machine Learning in Java (2016), Natural Language Processing with Java (2018) in drugih. Boštjan Kaluža je tudi avtor in sodelavec pri številnih patentih na področju odkrivanja anomalij in prepoznavanja vzorcev.

Opomba: intervju je bil prvotno objavljen v tiskani izdaji Demokracije.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

PODPRITE DEMOKRACIJO!

Drage bralke, dragi bralci, donirajte Demokraciji in podprite pluralnost slovenskega medijskega prostora!

Sorodne vsebine