Zaklada Adris odobrila je financiranje nastavka razvoja hrvatskog jezika u računalnom oblaku svijeta

Zaklada Adris je i ove godine odlučila financijski podržati, u iznosu od 100.000,00 HRK, daljnji razvoj i proširenje postojećeg digitalnog rječnika hrvatskog jezika na kojem radi znanstveno-istraživačka skupina na MATHOSu okupljena oko doc. dr. Domagoja Ševerdije. Postojeći rječnik, uz leksikon, sadrži i semantičko-sintaktičke značajke samih riječi te je povezan s drugim jezicima u tzv. LLOD (lingvistički oblak povezanih podataka) oblaku s ČA-KAJ-ŠTO narječjem. Posebnost ovih narječja upotpunit će se s metapodacima pojavnosti i uporabe (geolokacija porijekla i korištenja, vrijeme, zvučni zapis) riječi iz leksikona tih narječja. Na takav način u cjelosti se planiraju obuhvatiti glavna obilježja hrvatskog jezika koji počiva na ova 3 narječja.

Na tragu prošlogodišnje donacije Adris zaklade koja je financirala razvoj sveobuhvatnog rječnika koji je povezan s mrežnim oblakom svjetskih jezika i ove godine ista zaklada je upriličila dodatna sredstva u iznosu od 100.000,00kn za daljnji razvoj i proširenje istog rječnika.

Konačni cilj nastavka ovog znanstveno-istraživačkog rada jest dopuniti postojeći digitalni rječnik hrvatskog jezika koji osim leksikona sadrži i semantičko-sintaktičke značajke samih riječi te je povezan s drugim jezicima u tzv. LLOD (lingvistički oblak povezanih podataka) oblaku s ČA-KAJ-ŠTO narječjem. Posebnost ovih narječja upotpunit će se s metapodacima pojavnosti i uporabe (geolokacija porijekla i korištenja, vrijeme, zvučni zapis) riječi  iz leksikona tih narječja. Na takav način u cjelosti će se obuhvatiti glavna obilježja hrvatskog jezika koji počiva na ova 3 narječja.

Potporom Zaklade Adris 2018.g. realiziran je projekt: „Hrvatski jezik u mrežnom oblaku svjetskih jezika“ kojim se otvara novi put modernoga proširenja identiteta hrvatskoga jezika i hrvatske kulturne baštine. S prvim projektom http://ssf.mathos.hr (dr.sc. M. Orešković) stvoren je i provjeren SSF rječnik/tezarij standardnoga jezika s oko 1 milijun pojavnica te njegova uključenost u lingvistički oblak (LLOD cloud) svjetskih jezika, a s novim projektom se te iste riječi proširuju čakavskim, kajkavskim i štokavskim inačicama. Kao i za prvi projekt, tezarij prati odgovarajući korpus (digitalizirani dokumenti iz kojih se stvaraju riječi u tezariju), pa će se u novom projektu SSF proširiti s mnogim dokumentima hrvatskoga „ča-kaj-što“ trolista (D. Štambuk). S obzirom da se radi o nastavku postojećega projekta, tijek projekta je potpuno određen i jasan: nakon što su već na domaćim i međunarodnim skupovima objavljeni rezultati projekta, objavit će se i jedna (do dvije) knjige neposrednih rezultata, koje će biti uporište za sličan nastavak rada. Nakon toga se pristupa algoritamskom i programskom dijelu stvaranja mrežnoga okvira tonskog zapisa pojedinih riječi s bilo kojeg područja RH i okolice. Uzorak dobroga rješenja je već realiziran kao Zvučni atlas hrvatskih govora http://hrvatski-zvucni-atlas.com/ (V. Piškorec; I. Kurtović Budja), ali za razliku od profesionalnoga, segmentiranoga pristupa, ovdje se nudi mrežni pristup s bilo koje lokacije (npr. područne škola koja ima pristup internetu) i bilo koje veličine. Tako će se u SSF tezariju uz „ča-kaj-što“ zvučni zapis riječi, pojaviti i zvučni zapis višerječnica (frazema, poslovica i sl.) – pravoga blaga jednoga naroda, uz geolokaciju izvorišta. S naglašenom vremenskom osi, pak, spremat će se (i po želji pretraživati) digitalizirani dokumenti svih hrvatskih govora i narječja te bibliografski podatci o autorima tiskanih ili transkribiranih djela.

Ishod i doprinos projekta ogleda se u modernoj izvedbi integracije SSF mrežnoga okvira, digitaliziranih dokumenata, zvučnih zapisa te programskih temelja za ostale multimedijske objekte (slika, video) i to sve u geografsko-vremenskim koordinatama. Povezivanjem s udrugama koje se u lokalnoj zajednici trude i rade na očuvanju materinskoga govora, projekt ostvaruje najvažniji cilj svakoga bavljenja baštinom: povezivanje znanosti i nositelja kulturnoga dobra.