VOCR – Nástroj nejen pro rozpoznávání textu na obrazovce v macOS

Novinek v přístupnosti systému macOS není pro zrakově postižené v posledních letech rozhodně přehršle, a když už se nějaké objevily, tak nebyly nikterak závratné. Přeci jen se ale v nedávné době urodil poměrně zajímavý nástroj alespoň od vývojáře třetí strany, jež posunul přístupnost macOS o kus dál. Nástroj, který mám na mysli, slouží především pro OCR, tedy pro rozpoznávání textu,, v aktuálním okně nebo pod kurzorem VoiceOveru. Tuto funkcionalitu již dlouho známou uživatelům Windows jak od odečítače JAWS, tak NVDA, přináší do macOS bezplatný nástroj nazvaný VOCR. Nástroj může sloužit zejména k následujícím účelům:

  • Rozpoznání textu v obrázcích jak na webu, tak kdekoliv jinde v systému a to buď v celém aktuálním okně nebo pouze pod kurzorem VoiceOveru.
  • Rozpoznání textu v obrázkových PDF dokumentech.
  • Ovládání aplikací, jejichž ovládací prvky, jako tlačítka či editační pole, nejsou vůbec přístupné. Nástroj totiž umožňuje nejen OCR, ale také přivolání myši přímo na rozpoznaný text, kam můžete následovně kliknout. Je tak již možné bez pomoci vidící osoby například vytvořit virtuální stroj v aplikaci Parallels Desktop, kde není průvodce vytvářením virtuálního stroje doposud s odečítačem VoiceOver přístupný.

Kromě rozpoznávání textu nástroj VOCR umožňuje navíc i získání textového popisu aktuálního okna za pomoci umělé inteligence díky technologii Chat GPT-4 a následné kladení dalších dotazů k rozpoznávanému  obrazu. K této placené funkcionalitě je však nutný účet a API klíč od společnosti OpenAI. Popis této funkcionality je nicméně  nad rámec tohoto článku.

Stažení a instalace

Pro úspěšné zprovoznění nástroje VOCR je nutné přesně dodržet všechny následující kroky.

  1. Stáhněte zazipovanou aplikaci VOCR z tohoto přímého odkazu.
  2. Rozbalený soubor aplikace přesuňte do vaší složky Aplikace. Ve Finderu se do této složky dostanete nejsnadněji zkratkou Command + Shift + A.
  3. Ze složky Aplikace nástroj VOCR spusťte, například zkratkou Command + O.
  4. Ověřte, zda VOCR běží, přesunutím kurzoru VoiceOver do stavových nabídek přes zkratku VO + M + M, kde se můžete pohybovat přes VO + šipka doprava nebo doleva.
  5. Zkratkou VO + F8 spusťte Utilitu VoiceOver, tam přejděte do kategorie „Obecné“ a zaškrtněte volbu „Povolit ovládání funkce VoiceOver pomocí AppleScriptu“.
  6. Jestliže máte zapnutou clonu obrazovky, tak ji pomocí zkratky VO + Shift + F11 vypněte. Clona obrazovky musí být vypnuta, aby VOCR mohl obrazovku správně rozpoznávat.
  7. Ujistěte se, že máte vypnuté také vizuální prvky VoiceOveru. Viditelnost těchto prvků můžete přepínat zkratkou VO + Command + F11. Jestliže je necháte zapnuté, tak budou rozpoznávany i tyto prvky, jako je například titulkový panel VoiceOveru.
  8. Zkratkou Command + Control + Shift + W zkuste vyvolat nástroj VOCR. Mělo by vyběhnout oznámení žádající o oprávnění přístupnosti. Jestliže toto oznámení nevyběhne, tak jej zkuste nalézt mezi otevřenými okny přes zkratku VO + F1 + F1, kde šipkou doprava rozbalte položku „Systémové dialogy“, patřičné dialogové okno zde aktivujte Enterem a oprávnění příslušným tlačítkem udělte.
  9. Po udělení oprávnění přístupnosti znovu zkuste zkratkou Command + Control + Shift + W vyvolat nástroj VOCR. Mělo by vyběhnout další oznámení tentokrát žádající o oprávnění pořizovat snímky obrazovky. Oprávnění udělte podobně jako v předchozím bodě.
  10. Jestliže ani tak nemůžete nalézt okno pro udělení oprávnění, tak přejděte do Nastavení systému přes řádek nabídek, do něhož se dostanete přes VO + M, rozbalte nabídku Apple a tam Nastavení systému. V Nastavení systému přejděte v bočním panelu do kategorie „Soukromí a zabezpečení“. Potom jděte do části „Záznam obrazovky a systémového zvuku“, najděte položku VOCR a zapněte ji.
  11. Mělo by vyběhnout upozornění, kde aktivujte tlačítko „Ukončit a znovu spustit“. Pokud nevyběhne, tak nástroj VOCR vypněte přes stavové nabídky, do nichž se dostanete přes VO + M + M, najedete přes VO + šipka doleva nebo doprava na položku VOCR, aktivujete přes VO + mezerník, šipkou dolů najedete na položku „Quit“ a aktivujete mezerníkem. Poté VOCR znovu spusťte ze složky Aplikace.
  12. Opět zkuste zkratku Command + Control + Shift + W pro vyvolání nástroje VOCR. Jestli je vše výše uvedené správně nastaveno,tak by měl zaznít zvuk podobný kutálení hracích kostek a VOCR by měl ohlásit „Finished scanning“ následovaný názvem aktuálního okna.
  13. Nyní se zkuste pohybovat v rozpoznaném textu aktuálního okna přes klávesy Command + Control + šipka dolů nebo nahoru. Možná bude nyní potřeba povolit ještě čtení textu pomocí VoiceOveru, tak případně udělte také toto povolení příslušným tlačítkem v dialogu, který by měl vyběhnout.

Ovládání nástroje

Pro vyvolání rozpoznávání textu slouží následující zkratky:

  • Rozpoznání textu v celém aktuálním okně: Command + Control + Shift + W.
  • Rozpoznání textu jen v položce pod kurzorem VoiceOveru: Command + Control + Shift + V.

Po rozpoznání textu fungují pro navigaci v něm a další akce následující příkazy:

  • Pohyb dolů nebo nahoru: Command + Control + šipka dolů nebo nahoru.
  • Pohyb doleva nebo doprava: Command + Control + šipka doleva nebo doprava.
  • Pohyb doleva nebo doprava po znacích: Command + Control + Shift + šipka doleva nebo doprava.
  • Přesun na začátek nebo konec vertikálně: Command + Control + Page Up nebo Page Down.
  • Přesun na začátek nebo konec horizontálně: Command + Control + Home nebo End.
  • Kliknutí myši na aktuální pozici: VO + Shift + mezerník.
  • Ukončení navigačního režimu: Escape.
  • Ohlášení aktuálních souřadnic: Command + Control + L.

Některá důležitá nastavení nástroje

Do nastavení pro nástroj VOCR se můžete kdykoliv dostat globální zkratkou Command + Control + Shift + S . Zobrazí se nabídka, kde šipkou dolů najeďte na položku „Settings“ a rozbalte ji šipkou doprava. Následně se můžete pohybovat mezi různými volbami šipkou dolů nebo nahoru a stav voleb přepínat mezerníkem. Zajímavé mohou být zejména tyto volby:

  • Auto Scan: Pokud je zapnuto, tak bude ve výsledku rozpoznání textu po kliknutí myši přes VO + Shift + mezerník automaticky spuštěno nové rozpoznání textu.
  • Move Mouse: Určuje, zda má myš sama následovat pohyb při navigaci pomocí vvýše uvedených navigačních příkazů nástroje VOCR.
  • Launch on Login: Určuje, jestli se VOCR má sám spouštět po přihlášení do systému.

Další informace

 



AppleMacmacOS/OS XNástrojeOCRVoiceOver


Adam Samec
Jako nevidomý se zajímám o asistivní technologie pro zrakově postižené. Pracuji jako lektor a tester přístupnosti v Tyflokabinetu Praha. Mým hlavním zaměstnáním je však pozice programátora, konzultanta a testera přístupnosti v Microsoftu. V článcích se zaměřuji především na produkty značky...