Ondřej Sedláček, Newton Technologies: První zkušenosti s NEWTON Dictate Mobile pro sluchově postižené

23.07.2014 15:20

Česká unie neslyšících (ČUN) soustavně usiluje o zmírnění překážek bránících sluchově postiženým lidem v běžné komunikaci. Z druhu postižení vyplývá, že osoby se sluchovým postižením jsou nejzranitelnější při kontaktu s lidmi, kteří neovládají jejich způsob komunikace. Napomoci by tomu mohl nový projekt ČUN a firmy NEWTON Technologies, v jehož rámci v současné době pět dobrovolníků testuje softwarový přepis mluvené řeči do textu. Shrnutí prvních zkušeností s automatickým přepisem řeči prostřednictvím mobilního telefonu je obsahem následujícího příspěvku.

„Řekni mi to do mobilu, já si to přečtu!“
 
ČUN se s tímto námětem obrátila na firmu NEWTON Technologies, která již má dlouholeté zkušenosti s vývojem a používáním počítačových programů přepisujících mluvenou řeč do textu. Pro NEWTON Technologies to byla zajímavá výzva, a proto neprodleně přistoupila k vývoji aplikace použitelné v běžném „chytřejším“ mobilu. Výsledkem je NEWTON Dictate Mobile, který dnes prochází testovací fází. Testování se účastní pět dobrovolníků z řad sluchově postižených z různých míst České republiky, kteří se tento systém snaží vyzkoušet v každodenním životě.

Pět chytrých mobilních telefonů a SIM karty pro tento účel zapůjčila společnost Telefónica O2 Czech Republic. Vývojáři NEWTON Technologies do mobilů nainstalovali aplikaci umožňující spojení se serverem, na němž je uložen program NEWTON Dictate, který mluvené slovo osoby, s níž neslyšící uživatel komunikuje, převede na text, jenž se zobrazí na displeji přístroje. V praxi takový rozhovor může vypadat například tak, že neslyšící osoba položí otázku a odpověď, kterou druhá osoba po stisknutí tlačítka namluví do mobilu, si vzápětí přečte na jeho displeji.

První zkušenosti potvrzují, že přesnost přepisu do značné míry závisí na zřetelné výslovnosti mluvčího, hladině hluku v okolí a kvalitě datového připojení. Ve velkých městech datové připojení zpravidla nepředstavuje vážnější problém. Hůře jsou na tom v menších městech, kde je zatím rychlost malá nebo datové připojení není stálé. To se samozřejmě výrazně projevuje na kvalitě přepisu. Kvalita přepisu při dobrém připojení a dobré výslovnosti dosahuje až 90 procent úspěšně přepsaných slov, při dodržování pravidel správného diktování se běžně pohybuje kolem 75-80 procent, při horším připojení bohužel výrazně klesá, v nepříznivých podmínkách cca na 40-50 procent.

V průběhu testování nás překvapil rozdíl mezi rozpoznáváním mužských a ženských hlasů. Program o poznání lépe přepisuje mužské hlasy. Příčin může být více. Tento rozdíl mohou způsobovat například mikrofony, jimiž jsou vybaveny testovací mobily. Na vývoji hlasových modelů dále pracujeme a odstranění této nerovnováhy je jen otázkou času.
Testování nám pomohlo odhalit nejen problémy technického charakteru, ale mohli jsme si rovněž ověřit, že stejně důležité jako manipulovat s mobilem je umět vysvětlit náhodně osloveným lidem, proč by vůbec měli mluvit do telefonu, a dále je stručně seznámit s pravidly, jak správně na mobil mluvit (vzdálenost od mikrofonu, rychlost řeči, potřeba diktování interpunkčních znamének – „tečka“, „čárka“ apod.). Řešením jsou stručné  a přehledné informační kartičky, navržené podle zkušeností testerů, které jasně a srozumitelně vysvětlí, jak zařízení funguje, jak je používat i jak jeho prostřednictvím komunikovat.
Nemalou výhodou umožňující větší rozšíření a využití aplikace je to, že NEWTON Dictate Mobile v současné době funguje jak na operačním systému Win 6.5, který se používá v rámci dnešního testování, tak také na platformě Android, která se na poli chytrých telefonů těší stále větší oblibě. 

Přestože vývoj pokročil až do testovací fáze, ředitel NEWTON Technologies ing. Petr Herian varuje před přílišným optimismem, pokud jde o rychlost rozšíření systému pro běžné použití. „Nepředpokládáme,“ říká, „že program již nyní plně uspokojí potřeby neslyšících uživatelů. Očekáváme však, že nám neslyšící testeři poskytnou cenné poznatky pro další vývoj a sami si ověří, zda by v některých situacích pro ně už za současného stavu mohl být automatický přepis mluvené řeči do mobilu přínosem, například u lékaře, v zaměstnání, při jednání na úřadech a podobně.“

Tyto závěry jsou zatím předběžné, více nám ukáže detailní vyhodnocení projektu po ukončení testu. Již v této fázi ale vývojáři přistoupili k některým úpravám, které si sami testeři vyžádali. To, že se pětice testerů z řad sluchově postižených aktivně zapojila do vývoje, je nejlepším důkazem, že projekt má svůj smysl a nevede do slepé uličky.