Téčko: RoboBraille – tvorba přístupných dokumentů odkudkoli

Potřebujete někdy převést nepřístupný naskenovaný dokument do textové podoby, ale sedíte zrovna u počítače, na kterém není nainstalován žádný OCR software? Nebo potřebujete namluvit text syntetickým hlasem do MP3 souborů, aby se dal poslouchat v audio přehrávači, ale na počítači nemáte k dispozici žádný vhodný hlasový syntetizér SAPI? V takových situacích se vám může hodit RoboBraille.

Co je RoboBraille

Jde o bezplatnou webovou službu vyvinutou speciálně pro potřeby zrakově postižených. RoboBraille umí převádět dokumenty mezi různými formáty – grafické dokumenty lze převést do přístupných textových formátů, texty zase načíst syntetickými hlasy do MP3 souborů, z wordovských dokumentů lze generovat elektronické knihy EPUB či MOBI apod. Přitom RoboBraille podporuje češtinu – texty načítá českými hlasy a rozumí kódování českých znaků v textových dokumentech.

RoboBraille byl vyvinut v Dánsku před více než deseti lety. Po dánštině postupně přidával podporu dalších jazyků a začal fungovat i v dalších zemích. Kromě češtiny jej tedy lze používat i pro slovenštinu, angličtinu, němčinu i mnoho jiných evropských jazyků. Jeho používání pro nekomerční účely je zdarma a na jeho fungování v Česku přispívá nadace Velux.

Pojďme se podívat, jak můžeme RoboBraille v praxi využít…

Převod nepřístupných dokumentů do textu

Ať už budete mít tištěný text naskenovaný v grafických souborech jako JPG, TIFF, GIF, nebo PDF dokumenty, které neobsahují textová data, můžete je předhodit RoboBraillu, aby v nich text rozpoznal a uložil jej v textovém dokumentu. Postupovat budeme takto:

  1. V internetovém prohlížeči otevřeme úvodní stránku RoboBraillu. Její anglickou verzi najdeme na adrese robobraille.org, českou verzi na robobraille.org/cs a slovenskou na robobraille.org/sk. Další popis je podle české verze.
  2. Úvodní stránka obsahuje jednoduchý webový formulář, který nás ve čtyřech krocích převodem dokumentu provede. Než ale začneme, můžeme pomocí přepínačů na začátku formuláře určit, jaký je zdroj převáděného dokumentu. Vybraný je přepínač Soubor, čímž je myšlen soubor uložený v našem počítači. V případě potřeby zde máme ještě další dvě možnosti – přepínač URL adresa by nám umožnil zadat internetovou adresu, na které se nachází zdrojový dokument pro převod, při výběru přepínače Text bychom pro změnu mohli zapsat vlastní text, který bychom např. chtěli převést do audio souboru. My tedy necháme vybraný přepínač Soubor a postoupíme k nadpisu druhé úrovně „Krok 1 – Nahrajte svůj dokument“.
  3. Pod tímto nadpisem aktivujeme tlačítko Procházet. Otevře se klasický dialog pro výběr souboru. V něm tedy vybereme grafický soubor, který chceme převést do textové podoby. Označit můžeme i více souborů stejného formátu. Dialog potvrdíme a na webové stránce stiskneme následující tlačítko Nahrát. Vybraný zdrojový soubor se tak načte z našeho počítače na server RoboBraillu. Maximální velikost zdrojového souboru je omezena na 64 MB. V závislosti na velikosti a rychlosti připojení může načítání chvíli trvat. Jakmile je dokončeno, je o tom pod tlačítkem Nahrát zobrazena zpráva a pod ní se objeví další nadpis druhé úrovně, tentokrát „Krok 2 – Zvolte výstupní formát“.
  4. Pod tímto nadpisem tedy přejdeme do skupiny přepínačů pro výběr výstupního formátu. Na výběr zde máme možnost MP3 audio, kterou si popíšeme za chvíli, dále možnost Braille, tedy převod do souboru pro tisk na braillské tiskárně, potom možnost Elektronická kniha pro formát EPUB nebo MOBI a nakonec možnost Konverze zvyšující přístupnost. Zvolíme tento trochu nejasný přepínač, to je totiž převod do jednoho z přístupných textově orientovaných formátů.
  5. Jakmile si vybereme výstupní formát, zobrazí se pod přepínači nadpis „Krok 3 – Upřesněte volby konverze“. Pod přepínačem najdeme rozbalovací seznam, ve kterém si můžeme vybrat formát výsledného souboru. Výchozí možnost je formát DOC, můžeme ale zvolit také XLSX, RTF, TXT, přístupné PDF, HTML či CSV. U formátů DOCX, RTF či PDF se RoboBraille bude snažit zachovat i vzhled původní předlohy včetně vložených obrázků, u TXT samozřejmě zůstane zachován jen neformátovaný text.
  6. Pod nadpisem pro čtvrtý krok už jen do textového pole zadáme svou e-mailovou adresu a stiskneme tlačítko Odeslat. Zobrazí se stránka s potvrzením přijetí našeho požadavku a souhrnnými informacemi o zadaném převodu.

Během několika minut nám na zadanou e-mailovou adresu dorazí zpráva, která nás bude informovat, že převod byl proveden a v její příloze bude uložen výsledný dokument. Chybovost rozpoznávání se u běžných dokumentů zdá být lehce vyšší než např. u FineReaderu, nicméně rozdíl není nijak výrazný.

Převod textových dokumentů do audio souborů

Nyní si projděme, jak probíhá další z užitečných úloh, tedy namluvení zdrojového textového souboru syntetickým hlasem do MP3 souboru.

  1. Otevřeme úvodní stránku RoboBraillu na adrese robobraille.org/cs a na začátku formuláře necháme vybraný přepínač Soubor jako zdroj dat.
  2. V prvním kroku stiskneme tlačítko Procházet a v následném dialogu označíme zdrojový soubor. Může to být např. text ve formátu TXT, DOCX, RTF atd. nebo také grafický soubor, který si RoboBraille automaticky nejprve převede do textu, a z něj následně vygeneruje audio soubor. Vybraný soubor nahrajeme na server stiskem tlačítka Nahrát.
  3. V druhém kroku vybereme přepínač MP3 audio jako výstupní formát převodu.
  4. Ve třetím kroku můžeme upřesnit volby převodu. V případě převodu do audio souboru zde máme rozbalovací seznam s výběrem mluvčího. Jsou zde hlasy pro všechny podporované jazyky, pro češtinu je to dobře známá Zuzana a pak také Iva, což je vcelku přirozeně znějící a dobře srozumitelný hlas. V druhém rozbalovacím seznamu můžeme nastavit tempo řeči. Je zde celkem sedm možných úrovní.
  5. Ve čtvrtém kroku opět jen zadáme e-mailovou adresu pro zaslání výsledku a stiskneme tlačítko Odeslat. Zobrazí se stránka s potvrzením zadaného převodu.

Po chvíli nám na e-mailovou adresu dorazí zpráva s informací o výsledku. Převod textu do MP3 je časově náročnější. V závislosti na délce textu si tedy na zprávu musíme počkat – u několika málo stránek převod trval asi dvě minuty, u třísetstránkové knihy asi dvacet minut. Protože MP3 soubory mohou být poměrně velké, nezasílají se jako příloha e-mailové zprávy. Ve zprávě je ale přímý odkaz na stažení MP3 souboru, který je platný sedm dní od jeho vytvoření.

Kvalita audio souborů

Jak již bylo zmíněno, použité hlasy Zuzana a Iva jsou dobře srozumitelné. Určitě by si však zasloužil doladit rozsah tempa řeči, které lze volit v sedmi úrovních. Dvě nejpomalejší úrovně jsou totiž tak pomalé, že je reálně nemůže nikdo používat. Naopak nejrychlejší úroveň je dle mého již rychlá přespříliš.

Kvůli úspoře na velikosti výsledných audio souborů jsou relativně nízké i jejich kvalitativní parametry. Používá se vzorkovací frekvence 16 kHz a datový tok pouhých 24 kbps. U takových hodnot je redukce kvality zvuku již velmi zřetelná., nicméně pro poslech četby syntetickým hlasem se takováto kvalita dá stále ještě rozumně použít.

Chcete-li si udělat představu o kvalitě hlasu Iva a rozsahu nastavitelných rychlostí, stáhněte si ZIP soubor s ukázkami v MP3 (780 kB).

Další možnosti RoboBraillu

Výše popsané rozpoznávání textu v grafických souborech a převod textových souborů do MP3 jsou pravděpodobně nejpoužívanější funkce RoboBraillu. K dispozici tu ale máme ještě další dva výstupní formáty.

Pokud je zdrojovým souborem dokument strukturovaný nadpisy, lze jako výstupní formát zvolit elektronickou knihu. RoboBraille tak můžeme využít k vygenerování knih ve formátu EPUB nebo MOBI s definovanými kapitolami podle nadpisů ve zdrojovém souboru.

Poslední z výstupních formátů je Braille. Takto by mělo být možné získat soubory pro tisk na braillských tiskárnách. I zde by měla být podporována čeština. Je zde možno vybrat z velkého množství formátů. Máte-li s tímto jakoukoli zkušenost, určitě se do Téčka ozvěte. Byla by to jedna z dalších možností, jak jednoduše připravovat texty pro braillský tisk, a takový tip by v Téčku určitě zasloužil zveřejnit.

Ochrana osobních údajů

Při používání RoboBraillu vás možná napadne, co se děje s dokumenty a e-mailovou adresou, které službě při zadávání úlohy poskytujete. Provozovatel RoboBraillu tvrdí, že žádné z těchto údajů neukládá – zdrojový soubor je smazán ihned po jeho zpracování a e-mailová adresa ihned po odeslání závěrečné zprávy. Provozovatelem služby je navíc dánská neziskovka, u které bych nepředpokládal touhu po sběru cizích dat. Vadou na kráse v bezpečnosti RoboBraillu je však to, že nepoužívá zabezpečenou komunikaci pomocí protokolu HTTPS, ale jen obyčejné nezabezpečené HTTP. Jak citlivé dokumenty převádět přes takovouto online službu je tedy na zvážení každého z uživatelů.

Závěr

RoboBraille má méně možností pro převod audio souborů než některé specializované programy a kvalita výsledných MP3 je o něco nižší, než běžně používáme. Stejně tak i možnosti a přesnost OCR nejsou na úrovni např. FineReaderu. Nicméně i tak je RoboBraille velmi dobře a jednoduše použitelný nástroj a jeho obrovskou výhodou je, že ho má člověk k dispozici naprosto všude. Je tedy dobré, že jej máme a určitě v mnoha situacích najde své využití.

Další zdroje informací


Tento článek byl se souhlasem redakce přejat z archivu Téčka – technické přílohy časopisu Zora. Pokud máte zájem o aktuální zprávy, recenze, návody a další texty o technologiích pro zrakově postižené, zajistěte si předplatné Téčka, které je dostupné už od symbolických 75 Kč za rok.



OCRRoboBrailleTéčko


Jan Šnyrych
Jmenuji se Jan Šnyrych. Informační technologie mě zajímají už od středoškolského studia, a protože jsem zrakově postižený, jsem též aktivním uživatelem asistivních technologií. To jsou důvody, proč se už více jak dvacet let zabývám pomůckami pro zrakově postižené a přístupností...