Počítačové technologie k vašim službám

04.02.2014 17:04

V první části našeho seriálu o počítačových technologiích, jejichž praktické aplikace slouží sluchově postiženým uživatelům, se přeneseme do Plzně, kde se zabývají automatickým titulkováním televizních pořadů.  

Řada televizních diváků by při sledování televizních pořadů ráda využila skryté titulky. Důvody jsou nasnadě – špatná srozumitelnost mluvenému slovu pořadu vysílaného či poslouchaného v hlučném prostředí nebo vada sluchu na straně posluchače. Předem natočené pořady jsou titulkovány standardním off-line způsobem, ale titulkování živě vysílaných pořadů probíhá jiným způsobem – pomocí automatického rozpoznávání mluvené řeči, kdy převod mluvené řeči na text převádí počítač.  
Jak probíhá titulkování pořadů, jaké úspěchy mají za sebou ti, co automatické titulkování připravují, a co je teprve čeká, to jsem se vydala zjistit na pracoviště katedry kybernetiky Fakulty aplikovaných věd Západočeské univerzity v Plzni.
O počátcích celého projektu začíná vyprávět docent Luděk Müller: ,,První praktické zkušenosti s počítačovým přepisem mluveného slova televizních pořadů do textu vznikly na našem pracovišti v roce 2005, o rok později jsme proto požádali Ministerstvo školství, mládeže a tělovýchovy o projekt Eliminace jazykových bariér handicapovaných diváků České televize (ELJABR). Potřebnou finanční spoluúčast se zavázala hradit Česká televize (ČT), která byla ze zákona povinna vybavit skrytými titulky minimálně 70 procent vysílaných pořadů."
Pětiletý projekt ELJABR si stanovil dva cíle, prvním z cílů bylo vyvinout systém, který by byl schopen za pomoci technologie automatického rozpoznávání mluvené řeči titulkovat zpravodajské, diskusní, sportovní nebo další živé pořady vysílané ČT a druhým cílem pak bylo vyvinout systém, který dokáže automaticky vytvářet doprovodnou zvukovou stopu televizního pořadu pro diváky, kterým vadí snížená srozumitelnosti originálních dialogů současných pořadů.

DVA ZPŮSOBY TITULKOVÁNÍ Jak jsem se na katedře kybernetiky dozvěděla, v současné době probíhá titulkování dvojím způsobem. V prvním případě systém automatického rozpoznávání mluvené řeči rozpoznává přímo originální zvukovou stopu televizního pořadu a přepisuje ji do textu.
Na začátku projektu byly práce věnovány tomuto způsobu titulkování. První test systému automatického rozpoznávání originální zvukové stopy se uskutečnil v listopadu 2008 a týkal se přenosu ze zasedání Poslanecké sněmovny. Systém běžel nejprve rok a půl v experimentálním provozu a od března 2010 jej zajišťují řešitelé projektu pro ČT jako stálou službu.
Titulkování probíhá zcela pravidelně vždy, když zasedá Parlament České republiky a večer se vysílá na ČT 24 záznam z jeho zasedání v rámci televizního pořadu Záznam z jednání schůze PS PČR. Celkem bylo odvysíláno více než 750 hodin přenosů tohoto pořadu se skrytými titulky.
Druhý způsob titulkování se týká titulkování živých pořadů, u nichž je zvuková stopa obecně hůře rozpoznatelná. Například jde o živé diskuse, dále pořady s hlukem či vzdálenou řečí na pozadí, projev řečníků je spontánní, nespisovný, není pronášen do mikrofonu apod. Originální zvuková stopa pořadu je poslouchána a přemlouvána ve studiovém či kancelářském prostředí tzv. stínovým řečníkem, který původní záznam přemlouvá neutrálním způsobem do mikrofonu systému tzv. automatického diktátu, což je systém automatického rozpoznávání mluvené řeči zapisující v reálném čase diktovaný text. Způsob titulkování s využitím stínového řečníka se používá u živého pořadu Otázky Václava Moravce. Systém běžel taktéž nejprve půl roku v experimentálním provozu a od října 2011 jeho provoz zajišťují řešitelé projektu pro ČT jako stálou službu. Systém automatického diktátu je umístěn na notebooku stínového řečníka, který je spojen s titulkovacím zařízením přes internet, například z domova. Stínový řečník proto může pracovat všude tam, kde je dostupné připojení k internetu.

PRÁCI STÍNOVÉHO ŘEČNÍKA
NEMŮŽE DĚLAT KAŽDÝ Doktor Aleš Pražák mi zároveň dokazuje, že práce stínového řečníka není nejjednodušší: ,,Stínový řečník musí při své práci vykonávat velké množství paralelních činností – poslouchá originální zvukovou stopu pořadu, diktuje do počítače to, co slyší, a v případě, že mluví více řečníků zároveň, musí umět vybrat řeč hlavního řečníka. V případě, že řečník nemluví dobře, popřípadě příliš rychle, musí umět jeho řeč převést do korektního tvaru, popřípadě řeč zestručnit tak, aby se text vešel do titulků, které mají omezený prostor." A ještě dodává: "Když se v pořadu objeví slovo, které systém automatického rozpoznávání mluvené řeči nezná, musí slovo přidat do slovníku." Pro výběr řečníků a jejich výuku je použito speciální patentově chráněné zařízení, tzv. trenažér pro výuku stínových řečníků. Přesnost vytváření titulků tímto způsobem dosahuje až 98 procent.
Na projekt ELJABR navázal ELJABR II. Dky němu mohlo titulkování pořadů pokračovat. V únoru letošního roku bylo spuštěno pravidelné podtitulkování dalšího televizního pořadu ČT Hyde park. Pro sportovní nadšence proběhlo v květnu experimentální titulkování třech zápasů českých hokejistů na mistrovství světa v hokeji a v červnu titulkování dvou zápasů českých fotbalistů na mistrovství Evropy v kopané. V současné době probíhá titulkování pátečního pořadu Star Dance a těší se velkému ohlasu. Na webových stránkách www.kochlear.cz probíhá diskuze s řešiteli projektu, z řad diváků přichází poděkování, názory i nápady, jak titulkování ještě vylepšit.
,,Domníváme se, že současná technologie nám umožňuje vyvinout a zajistit provoz titulkování prakticky libovolného televizního pořadu, ale protože provoz služby není beznákladový, musela by ČT alokovat ve svém finančním rozpočtu prostředky na tuto činnost. Záleží tedy nejspíše i na kvótách procent televizních pořadů, které je ČT ze zákona povinna vybavit skrytými titulky", uzavírá docent Luděk Müller.
Tímto však práce odborníků ze Západočeské univerzity v Plzni nekončí. Čekají je ještě další úkoly. I nadále se budou zabývat titulkováním dalších živých pořadů, budou vytvářet doprovodné zvukové stopy televizního vysílání a v neposlední řadě se pokusí generovat znakový jazyk systémem Avatar, což s největší pravděpodobností půjde ruku v ruce s postupným výzkumem českého znakového jazyka.
Celému týmu budeme držet palce.

Foto: Stínový řečník přemlouvá původní záznam
Foto: archiv ZČU

O autorovi: Autorka: Kateřina Horáková

Klíčová slova: