Chat GPT a nové funkce živého sledování fotoaparátu a obrazovky v hlasovém režimu – užitečná novinka i pro uživatele se zrakovým postižením (2. část)

Aplikace ChatGPT postavená na umělé inteligenci v nedávné době představila předplatitelům v České republice dvě nové funkce dostupné v hlasovém režimu – sledování fotoaparátu a sledování obrazovky. Prvnímu zmiňovanému jsem se věnovala v prvním díle této krátké série. Dnes se blíže zaměříme na funkci sledování obrazovky, která mezi uživateli se zrakovým postižením rovněž najde své využití.

Spuštění sledování obrazovky a základní ovládání

Druhou funkcí, kterou hlasový režim v ChatGPT nově zpřístupnil, je živé sdílení obrazovky. Přístup k této funkci může být na první pohled trochu komplikovanější. Nejprve je potřeba dostat se na tlačítko „nabídka více“ a po jejím rozkliknutí stisknout „sledování obrazovky.“ Poté bude uživatel ještě jednou dotázán, zda opravdu chce sledování obrazovky povolit.

Následně je potřeba nechat aplikaci ChatGPT běžet na pozadí, přičemž hlasové ovládání zůstane nadále aktivní. Poté může uživatel běžně pracovat se svým chytrým telefonem a na ChatGPT se kdykoliv obrátit s dotazem.

Během testování se mi několikrát stalo, že aplikace ztratila spojení a bylo nutné se do ChatGPT opakovaně vracet, čímž se většinou spojení automaticky obnoví. Také není výjimkou, že se hlas na chvíli zasekne a přestane reagovat. V případě, že tuto funkci tedy chcete efektivně používat, je potřeba mít rychlé a kvalitní připojení k internetu.

Využití při popisu obrázků i v nepřístupných aplikacích

Zpočátku jsem byla k této funkci na rozdíl od funkce živého sledování fotoaparátu poněkud skeptická, a to především s ohledem na to, že sdílení obrazovky nebude pro uživatele se zrakovým postižením mít velké využití. Při experimentování jsem však byla vyvedena z omylu.

Hlavní využití této funkce vidím ve dvou situacích – práci s obrazovým materiálem a popisem grafiky a při práci s nepřístupnými prvky aplikací.

Jednodušší práce s fotkami

Nejprve jsem se rozhodla sdílení obrazovky vyzkoušet při práci s fotkami. Jistě jste již slyšeli o funkci Be my AI v aplikaci Be my Eyes, která pro popis fotografií využívá právě ChatGPT. Abychom dosáhli výsledků, je potřeba buďto fotografii  pořídit přímo skrz aplikaci nebo do ní nahrát již existující obrázek. V případě sdílení obrazovky toto zcela odpadá a popis je tak možné provést ihned, a to pouze na hlasové vyžádání.

Otevřu si tedy např. knihovnu s fotkami a rozkliknu první fotografii, načež mi na příkaz ChatGPT obrázek popíše. Obrovskou výhodou je i to, že můžu ihned fotografie mezi sebou porovnávat (např. dotaz „v čem se fotografie na obrázku liší od předchozí“) nebo se doptávat na jejich kvalitu, ostrost atd. Živé sledování obrazovky je tak velkým pomocníkem při samostatném třídění fotografií nebo tvorbě příspěvků na sociální sítě.

Využití i na sociálních sítích

Při procházení sociálních sítí najde funkce sdílení obrazovky rovněž své využití. Všichni víme, že výraznou část obsahu na sítích tvoří obrázky a fotky bez alternativního popisku. Pokud jsme se dosud chtěli přesvědčit o tom, co se na obrázku nachází, museli jsme si jej stáhnout a pak nechat popsat určitou aplikací. Při sdílení obrazovky je možné obrázek nechat popsat ihned, a to dokonce velmi detailně. Uživatelé se zrakovým postižením tak nyní mohou mnohem efektivněji pracovat i se sítěmi jako Instagram nebo formáty jako příběhy na Facebooku. Jediným nedostatkem je to, že ChatGPT zatím příliš dobře nespolupracuje s automaticky se spouštějícími videi, která občas hlasové ovládání deaktivují.

Nepřístupná tlačítka a další prvky

Posledním experimentem, který jsem se sdílením obrazovky provedla, byla práce s nepříliš dobře přístupnými aplikacemi nebo weby. Určitě známe situace, kdy např. potřebujeme pracovat s aplikací, kde nejsou správně popsána tlačítka, a tak jako uživatelé odečítače nevíme, k čemu dané tlačítko přesně slouží. A právě v takovém případě může přijít k ruce sdílení obrazovky.

ChatGPT si poměrně dobře poradí se sledováním označení kurzoru VoiceOveru, a dokáže tak určit,  na kterém prvku se právě s odečítačem nacházíme. Posunu-li se tedy kurzorem na nepřístupnou položku, jako je třeba tlačítko a zeptám se, k čemu dané tlačítko slouží, dokáže ChatGPT jeho funkci popsat s velkou přesností. To stejné platí i v případech nepopsané grafiky, barev, zaškrtávacích polí nebo dokonce při interpretaci grafů nebo nejrůznějších schémat.

Nízký počet povolených dotazů práci komplikuje

Na závěr je třeba bohužel dodat, že i pro předplatitele ChatGPT pro není zatím limit pro sdílení fotoaparátu a obrazovky příliš velký. Jen pro základní otestování obou funkcí jsem vyčerpala dvoudenní limit. To znamená, že funkce není určena k dlouhodobějšímu používání. Pokud by se limit dotazů zvýšil, rozhodně si dokážu představit běžnou práci se sdílenou obrazovkou, a to především na sociálních sítích.


ChatGPT a nové funkce živého sledování fotoaparátu a obrazovky v hlasovém režimu – užitečná novinka i pro uživatele se zrakovým postižením



ChatGPT


Pavlína Soušková
Jmenuji se Pavlína Soušková. V 5 letech mi byla diagnostikována Stargardtova nemoc, což je juvenilní forma makulární degenerace. Ve zkratce to znamená, že postupně přicházím o zrak a v současné době jsem prakticky nevidomá. Mám jenom malé procento periferního vidění,...