Google uvolnil Android Accessibility Suite 15: TalkBack pohání umělá inteligence

Google uvádí do oběhu aktualizovaný odečítač TalkBack, konkrétně verzi 15.0, která přináší zejména rozšířené možnosti použití umělé inteligence.

Nejedná se pochopitelně pouze o odečítač samotný, ale o celý produkt Android Accessibility Suite, nebo chcete-li nástroje přístupnosti pro Android.

Nejvýraznější novinkou je přidání popisů obrázků založených na Gemini. Podívejme se na to, co je nového v TalkBack 15.0. Vezměte prosím na vědomí, že zavádění aktualizace je postupné, takže pokud ještě update nevidíte, buďte trpěliví – měl by se dostat do vašeho zařízení v následujících dnech.

Jestliže vás ale nové funkce zajímají a nechcete čekat na oficiální zpřístupnění v ČR, což může trvat i několik týdnů, v závislosti na probíhajících aktualizačních vlnách, můžete si stáhnout instalační apk soubor s úplně poslední verzí 15.0.1.

Mám balíčky z oficiálního zdroje (APKMIRROR), takže není třeba se obávat malwaru, tyto jsou podepsány přímo Googlem.

Odkazy přikládám:

Popis obrázků založených na Gemini

Google zavedl popisy obrázků a ikon v TalkBacku počínaje verzí 14.1. Tyto popisy však byly často nedokonalé a nespolehlivé a byly generovány offline na zařízení po stažení potřebných dat.

TalkBack 15.0 posouvá popisy obrázků na novou úroveň implementací popisů obrázků založených na Gemini. Nyní, když vyberete možnost „Popsat obrázek“ z nabídky TalkBacku – nebo pokud jste jí přiřadili gesto – budete dotázáni, zda chcete použít podrobné popisy obrázků AI. Můžete také tuto funkci povolit v nastavení TalkBacku > Popis obrázků a ikon > Podrobné popisy obrázků. Mějte na paměti, že automatické popisy stále používají stará offline data.

Výsledkem použití nového detailního rozpoznávání obrázků jsou podrobnější, bohatší popisy. Současná implementace však má svá omezení.

Nové popisy obrázků založené na AI jsou generovány online pro většinu telefonů. Ačkoli jsou výsledky získány rychle s minimální dobou čekání, TalkBack se nevrací k offline, méně podrobným popisům, když není k dispozici připojení k internetu. Dalším bodem stojícím za zmínku je, že pro automatické popisy obrázků si můžete vybrat, zda chcete použít generativní AI na zařízení, pokud máte telefony Pixel 9 series.

Co se týká derivátu od společnosti Samsung, tak jejich TalkBack prozatím tyto nové AI funkce neobsahuje.

Blíží se technologická konference jihokorejského výrobce, na které by měl představit novou verzi svého uživatelského prostředí One UI.

Uvidíme, zda toto přinese i nově implementovaný TalkBack, jenž v této oblasti dožene ten od Googlu.

Opět mě to nutí zamýšlet se nad tím, proč došlo v této oblasti ke kooperaci Googlu a Samsungu, když se jejich produkty rozcházejí a jihokorejci jsou pořád ti druzí..

Místo toho, aby ze vzájemné spolupráce oba giganti profitovali, každý z nich si evidentně „hrabe na vlastním písečku.“

Dalším problémem stojícím za zmínku je detekce textu. Na rozdíl od špatných offline popisů obrázků se TalkBack tradičně dobře osvědčil v detekci textu a ikon, přesně rozpoznávající text v obrázcích a zaměřených položkách. S online popisy založenými na Gemini je však detekovaný text nyní součástí obecného popisu. To znamená, že Gemini se rozhodne, jak text přečíst, což často vede jen k obecnému shrnutí nebo částečnému rozpoznání.

Stojí za zmínku, že automatické detekce stále používají offline data, včetně detekce textu, ale tato metoda je méně pohodlná – zejména pokud povolíte rozpoznávání ikon a textu pro všechny položky, nejen pro nepopsané.

Manuální ovládání čtení interpunkce

TalkBack 15.0 zavádí manuální kontrolu nad čtením interpunkcí, ale je nutno počítat s tím, že možnosti nastavení jsou pouze základní. Nyní si můžete vybrat mezi volbami – všechna, většina nebo některá. „Všechna“ čte veškeré interpunkce, zatímco „Některá“ čte pouze určitá znaménka. Tato funkce neovlivňuje navigaci po znacích a lze ji spravovat z nastavení výřečnosti nebo přidáním do ovládacích prvků čtení v části Přizpůsobit nabídky v nastavení TalkBacku.

Braillská klávesnice a hmatový displej

Při používání podporovaného hmatového displeje nebo psaní na braillské klávesnici TalkBacku můžete nyní vybírat text od kurzoru směrem na jeho začátek nebo konec.

  • Hmatový displej: stiskněte mezerník plus body 1,2,3,7,8 pro výběr od kurzoru na začátek textu
  • Hmatový displej: stiskněte mezerník plus body 4,5,6,7,8 pro výběr od kurzoru na konec textu
  • Braillská klávesnice: pro výběr textu od kurzoru na začátek přidržte body 4 a 5, poté kdekoli na displeji švihněte dvěma prsty nahoru
  • Braillská klávesnice: pro výběr textu od kurzoru na konec přidržte body 4 a 5, poté kdekoli na displeji švihněte dvěma prsty dolů

Další vylepšení

Číst od další položky se nyní nazývá Číst od aktuálně zaměřené položky, aby bylo jasné, jak tato funkce nyní pracuje – začíná číst z aktuálně zaměřené položky místo od té následující.

Dle zkušeností to vypadá na vylepšenou odezvu, ale nelze to nezávisle ověřit. Musíme vyčkat, až bude aktualizace dostupná na vyšším počtu zařízení, aby bylo možné toto globálně posoudit.

Nyní můžete otevřít kontaktní stránku podpory Google pro hendikepované osoby z nastavení TalkBacku pomocí nové možnosti Kontaktovat podporu pro osoby se zdravotním postižením.

Závěr

Nový update sice nenabízí převratné množství novinek, ale především zapracování rozpoznávání obrázků pomocí Gemini může být pro nevidomé uživatele velice přínosné. Taktéž nové možnosti v rámci generativní AI, která je přímo integrována do nových Pixelů řady 9 zní přinejmenším hodně zajímavě.

Uvidíme, nakolik to bude použitelné v praxi a zda se časem objeví i podpora českého jazyka. V rámci Gemini by to nejspíš fungovat mělo, jelikož tato už Češtinu ovládá. Bude na uživatelích TalkBacku, aby toto odzkoušeli a podělili se s námi o zjištěné skutečnosti.

Dle zahraničních postřehů to vypadá, že Gemini je v tomto ohledu velice úspěšná. Dokonce ji nechali rozpoznat dva obrázky se známými politiky a oba byli AI korektně identifikováni.

Tento článek byl sepsán na základě uživatelských zkušeností z používání nové aktualizace odečítače obrazovky, využity byly rovněž oficiálně dostupné texty. Pokud si chcete poslechnout, jak vypadá úvodní obrazovka aktualizované aplikace, můžete si stáhnout krátký zvukový podcast, v němž demonstruji souhrn nových funkcí.

Použité zdroje:

Článek původně vyšel na webu androidbezzraku.wordpress.com. Upraveno.




Android Accessibility Suite


Matěj Plch
Jmenuji se Matěj Plch a jsem od narození nevidomý. Deset let jsem se intenzivně věnoval propagaci mobilní platformy Google Android, kterou sám používám a podařilo se mi její přístupnostní nástroje rozšířit mezi české uživatele.