Seminár o jazykových dátach a digitalizácii archívu BTA v Bulharskej akadémii vied

Dnes, 8. októbra, sa v centrálnom sídle Bulharskej akadémie vied koná seminár organizovaný Európskym priestorom pre jazykové dáta a Inštitútom pre bulharský jazyk. Tento seminár sa zameriava na význam jazykových dát pre rozvoj jazykových technológií a nástrojov založených na umelej inteligencii.

Na podujatí sa predstaví aj skúsenosť Bulharskej tlačovej agentúry (BTA) v oblasti digitalizácie svojho archívu. Medzi účastníkmi bude aj Svoboda Todorova, vedúca projektu v rámci Plánu obnovy a odolnosti BTA, ktorá sa zúčastní panelovej diskusie na tému „Vytváranie a správa jazykových dát v Bulharskej tlačovej agentúre“.

Todorova sa zameria na úsilie BTA o digitalizáciu a moderné riadenie textových a fotoarchívov, ktoré obsahujú viac ako 5 miliónov strán a 1,8 milióna fotografií. Podčiarkne potrebu jednotnej infraštruktúry, štandardizovaných metadát a verejného prístupu k informáciám, ako aj úlohu umelej inteligencie pri automatickej anotácii, sémantickom vyhľadávaní a budovaní jazykových korpusov.

BTA plánuje aj partnerstvo s Národným tímom pre umelú inteligenciu, ktoré by malo podporiť implementáciu technológií AI na uchovávanie a inteligentné využívanie archívov. Počas seminára bude predstavená aj európska platforma „Európsky priestor pre jazykové dáta“, ktorá sa zameriava na zber, vytváranie, zdieľanie a opätovné využitie viacjazyčných a multimodálnych jazykových dát. Očakáva sa, že účastníci budú diskutovať aj o výzvach spojených s vytváraním, správou a distribúciou týchto dát v Bulharsku.