Liberecký kraj má zájem o program automatického přepisu mluveného slova z TUL
- 30. 11. 2007 00:00
[id:5890|autor:Mgr. Langer Jiří|email:jiri.langer@kraj-lbc.info|telefon:485 226 302|mobil:|aktualizace:]
Program automatického přepisu mluveného slova, na kterém pracuje vědecký tým z Ústavu informačních technologií a elektroniky na Technické univerzitě v Liberci, by byl užitečný i pro Liberecký kraj. Při prezentaci programu to řekl liberecký hejtman Petr Skokan.
„Na místě jsem se přesvědčil, že program je schopný prakticky souběžně přepisovat zvukový záznam z jednání do písemné podoby. Myslím, že by se to dalo využít pro záznamy z jednání krajského zastupitelstva. Podle klíčových slov by se pak dalo vyhledat, kdo co přesně řekl. Umím si představit, že bychom vytvořili archív záznamů jednání přístupný veřejnosti,“ řekl Skokan po shlédnutí textového záznamu běžícího souběžně s projevy zastupitelů ze zasedání krajského zastupitelstva.
Podle vedoucího vědeckého týmu profesora Jana Nouzy má slovník systému k dispozici asi 300 tisíc slov a dokáže audiozáznam převádět do psaného slova s přesností zhruba 80 procent. Hovoří-li zkušený moderátor v ideálním prostředí, spolehlivost stoupne až na 95 procent. V hlučném prostředí a mluví-li více lidí najednou, přesnost zápisu naopak klesá. „Dnes už jsme v tak pokročilém stádiu vývoje, že jsme schopni systém přizpůsobit konkrétní situaci – to znamená rozšířit jazykovou zásobu o výrazy typické pro určitou profesi. V případě státní správy to mohou být třeba jména radních a členů zastupitelstev, zkratky či frekventované názvy ulic. Jsme dokonce schopni analyzovat hlasové charakteristiky řečníka a rozpoznat tak, kdo právě mluví,“ přiblížil schopnosti programu jeden z jeho tvůrců Jindřich Žďánský.
V blízké budoucnosti by automatický přepis dokumentů a rozpoznání hlasu řečníka mohl také pomoci zrychlit a zefektivnit práci soudů. "Po prvních pokusech uskutečněných ve spolupráci s Okresním soudem v Liberci věříme, že program bude schopný buď okamžitě či ze záznamu přepisovat soudní rozhodnutí do písemné podoby a potenciálně tak může nahradit nákladnou a zdlouhavou práci přepisovatelek," řekl člen týmu Petr Červa. Ředitelka správy Okresního soudu v Liberci Kamila Břachová již dříve připustila, že pro soudnictví by to znamenalo významnou úsporu. Přesto, že přepis bude těžko kdy stoprocentně přesnou kopií mluveného slova a vždy bude zřejmě nutné, aby text někdo editoval.
Možnost rozpoznání osoby, jež zrovna hovoří, pak bude podstatná především pro policii. Takový program by například pomohl odhalit lidi, kteří se baví telefonickým šířením poplašných zpráv.
Systém přepisu mluveného slova do textové podoby není podle Nouzy úplná novinka. Existuje pro angličtinu, němčinu a pár dalších velkých jazyků. „ Na češtinu si však žádná z několika světových firem, které se tím zabývají, netroufla. Je to totiž podstatně náročnější. Jen skloňovánía časování znamená výrazný nárůst nezbytné slovní zásoby,“ shrnul Nouza.
Výzkumný tým profesora Nouzy úspěšně spolupracuje s firmou Newton Media a některými televizními či rozhlasovými stanicemi. Zejména veřejně právní média vidí v novém programu šanci, jak zvládnout své obrovské archivy. Také využití ve státní správě se podle libereckého hejtmana jeví jako reálné a praktické.
„Možnost přizpůsobení tohoto systému potřebám Krajského úřadu a jeho následné využití bude určitě předmětem jednání rady kraje a krajského zastupitelstva. Myslím, že bychom mohli také účinně podpořit výzkum na liberecké univerzitě z prostředků, které má možnost Krajský úřad získat,“ řekl Petr Skokan.
Jaroslava Kočárková
tisková mluvčí
Technické univerzity v Liberci