Skip to main content

27

MAJ

11:00

Enostavni pogovori s podatki

Predstavitev platforme AI-on-Demand za kulturno dediščino


Osnovni podatki

27. maj 2024 ob 11:00 do 27. maj 2024 ob 14:00
Atrij ZRC, Novi trg 2, Ljubljana in zoom
Opis

Pridružite se nam osebno v Atriju ZRC, Novi trg 4, Ljubljana ali spremljajte dogodek v živo na spletu (prijavite se tukaj).

Način dela s podatki se dramatično spreminja, glavno gonilo teh sprememb pa so veliki jezikovni modeli (LLM) kot so ChatGPT-4o, LLama 3 in Mixtral 8x22. Spreminjajo pravila igre pri ravnanju z vsemi vrstami podatkov od internih podatkovnih zbirk do objavljanja za širšo javnost. Vendar včasih celo specialisti težko sledijo hitremu razvoju umetne inteligence, zato je dobrodošel pregled orodij in možnosti v kulturni dediščini in arheologiji.

Z veseljem vas vabimo na predstavitev platforme AI-on-Demand. Dogodek je namenjen strokovnjakom s področja kulturne dediščine, ki jih zanima uporaba umetne inteligence, vendar bo pritegnil vse, ki se ukvarjajo s podatki, a niso podatkovni analitiki ali informatiki.

Uvodoma bomo predstavili platformo AI-on-Demand, katere namen je spodbujati evropske raziskave in inovacije na področju umetne inteligence, ki so kakovostne, zanesljive in varne. Poudarek bo na predstavitvi pomena platforme za sektor kulturne dediščine.

Sledile bodo tri predstavitve konkretnih primerov uporabe. Benjamin Štular in Edisa Lozić bosta predstavila, kako veliki jezikovni modeli spreminjajo delo s podatki s tako imenovanim s poizvedbami obogatenem generiranju vsebin (angl. retrieval augmented generation – RAG). Vse koncepte bosta predstavila s študijskimi primeri iz področja arheologije. Ronald Harasim bo obravnaval uporabo umetne inteligence v digitalnem arhivu, pri čemer se bo osredotočil na izboljšanje obdelave in shranjevanja podatkov s tehnologijami, kot sta optično prepoznavanje besedila (OCR) in prepoznavanje slik. Žiga Kokalj bo predstavil orodje za samodejno odkrivanje arheoloških sledov v podatkih zračnega laserskega skeniranja z uporabo strojnega učenja ter prikazal relativno preprostost njegove uporabe.

Dogodek bo potekal v angleščini in bo odlična priložnost za spoznavanje platforme AI-on-Demand in drugih možnosti uporabe umetne inteligence na področju kulturne dediščine ter tudi za mreženje s strokovnjaki s tega področja.

Program in izvlečki

  • Edisa LOZIĆ
    Predstavitev platforme AI-on-Demand
    AI-on-Demand (AIoD) je platforma, namenjena povezovanju skupnosti na področju umetne inteligence ter s tem krepitvi raziskav in inovacij na evropski ravni, hkrati pa zagotavlja evropski pečat kakovosti, zanesljivosti in razložljivosti. Predstavljen bo pomen te platforme za kulturno dediščino.
     
  • Benjamin ŠTULAR in Edisa LOZIĆ
    Enostavni pogovori s podatki: pregled za kulturno dediščino
    Način dela s podatki, doživlja pomembno preobrazbo. V središču tega procesa so veliki jezikovni modeli. Ti spreminjajo pravila igre pri ravnanju z vsemi vrstami podatkov, od internih baz znanja do dokumentacije, namenjene javnosti, in podpore strankam. Ena od tehnik za nadgradnjo velikih jezikovnih modelov z lastnimi podatki je RAG (angl. retrieval augmented generation) oziroma s poizvedbami obogateno generiranje vsebin.
    Predavatelja bosta predstavila najnovejše stanje na področju uporabe umetne inteligence pri ravnanju s podatki. Na treh študijah primerov bosta prikazala, kako se lahko ukvarjamo s strukturiranimi (npr. podatkovna zbirka), polstrukturiranimi (npr. tiskani katalog) in nestrukturiranimi podatki (npr. besedilo v PDF datoteki). Vse študije primerov so s področja arheologije, vendar so koncepti splošno uporabni.
    Poudarek bo na metodah, ki jih je mogoče uporabljati brez predhodnega znanja o umetni inteligenci ali razvoju aplikacij. Predstavila bosta tudi orodje BmyRAG, ki za vsakega uporabnika, ne glede na predhodno znanje in opremo, izdela prilagojen načrt za začetek razvoja aplikacije RAG.
    BmyRAG
     
  • Ronald HARASIM
    Uporaba umetne inteligence za obdelavo in analizo arhivskih podatkov
    Hiter razvoj in postopno povečevanje števila arheoloških podatkov predstavljata izziv pri njihovi učinkoviti obdelavi in arhiviranju. Ta proces lahko optimiziramo z uporabo sodobnih tehnologij, kot je umetna inteligenca. S tehnikami, kot so optično prepoznavanje znakov (OCR), obdelava naravnega jezika, prepoznavanje slik in drugi algoritmi, je mogoče pretvoriti velike količine raznovrstnih podatkov v pregledne podatkovne zbirke in po njih enostavno iskati.
    Predstavitev vključuje kratek pregled uporabljenih tehnologij, v ospredju pa bo prikaz sistema AIS ČR, kjer številne možnosti teh tehnologij že uporabljajo v praksi. Prikazano bo, kako lahko ta orodja zmanjšajo količino ročnega dela, potrebnega za obdelavo podatkov, ter povečajo hitrost in učinkovitost njihove nadaljnje obdelave.
     
  • Žiga KOKALJ
    ADAF – do uporabnika prijazno orodje za samodejno odkrivanje arheoloških značilnosti
    Potreba po uporabi strojnega učenja (angl. machine learning – ML) v arheologiji se s hitrim razvojem tehnik analize slik in vse večjo razpoložljivostjo kakovostnih podatkov, pridobljenih z zračnim laserskim skeniranjem (ZLS; tudi lidar), nenehno povečuje. Orodje za samodejno zaznavanje arheoloških značilnosti (ADAF) je bilo razvito, da bi uporabnikom omogočili enostavnejšo uporabo programske opreme, temelječo na modelih strojnega učenja (zlasti na konvolucijskih nevronskih mrežah), ki omogočajo samodejno zaznavanje arheoloških značilnosti iz podatkov ALS. Programska oprema zahteva minimalno interakcijo, brez predhodnega uporabniškega znanja o tehnikah strojnega učenja, kar močno poveča njeno dostopnost arheološki skupnosti. Kot učna množica za te modele je bil uporabljen obsežen arhiv podatkovnih nizov ALS na Irskem, ki so jih strokovnjaki označili s tremi vrstami arheoloških značilnosti (nasipi, gradišča, gomile). Osrednji komponenti orodja sta Relief Visualisation Toolbox (RVT) in Artificial Intelligence Toolbox for Earth Observation (AiTLAS), ki se široko/pogosto uporabljata na področju arheologije iz zraka. RVT je nepogrešljiv za obdelavo vhodnih podatkov (za učenje in sklepanje) s pretvorbo digitalnih modelov višin v vizualizacije, primerne za obdelavo s strojnim učenjem, AiTLAS pa omogoča dostop do modelov strojnega učenja. Izvedli smo vrsto poskusov z različnimi metodami vizualizacije in različnimi strojnimi arhitekturami za zaznavanje predmetov in semantično segmentacijo, da bi določili optimalne nastavitve za programsko opremo.

Preiskusite

O predavateljih

Ronald Harasim je začel programirati pri 12 letih. Nikoli ni zaključil univerzitetne izobrazbe, čeprav je pet let študiral informatiko s poudarkom na umetni inteligenci, pet let pravo, tri leta klasično arheologijo, dve leti filozofijo ter dve leti matematiko in fiziko. Med študijem je delal in ustanovil podjetje IT. Trenutno vodi mednarodno IT-družbo, v preostalem času pa dela na Inštitutu za arheologijo Češke akademije znanosti.

Žiga Kokalj je znanstveni sodelavec in vodja Oddelka za daljinsko zaznavanje na IAPŠ ZRC SAZU ter izredni profesor na Univerzi v Ljubljani.

Edisa Lozić je znanstvena sodelavka na ZRC SAZU in docentka na Podiplomski šoli ZRC SAZU.

Benjamin Štular je znanstveni svetnik na ZRC SAZU in izredni profesor na Podiplomski šoli ZRC SAZU.