Jieshuo 20240115: Stabilní verze přináší podporu umělé inteligence a mnoho dalších vylepšení

Vážení fanoušci a příznivci čínského odečítače Jieshuo!

Den, na který jsme tak toužebně čekali, konečně nadešel. Po čtrnácti náročných týdnech vývoje Li uvolnil další oficiální aktualizaci. Kromě toho, že byla provedena velká spousta oprav a optimalizací, tak došlo i na implementaci zcela nových funkcí. Těšit se můžete třeba na konfigurovatelné pokročilé scénáře pro hlasové výstupy nebo nové možnosti ovládání pomocí kombinace tlačítek hlasitosti a dotykového displeje.

Nejrevolučnějším přírůstkem je ale integrovaná podpora umělé inteligence za použití fotoaparátu. Tato vychytávka je ale zpřístupněna pouze platícím uživatelům, tzn. těm, kteří mají zakoupenou licenci na prémiovou verzi aplikace. Vývoj nové aktualizace byl tentokrát mimořádně náročný. Během implementace nových funkcí se totiž objevila řada problémů, jež bylo nutno vyřešit a odstranit. Pro příklad mohu zmínit neohlašování zdroje příchozích notifikací, nesprávné napojování dalšího textu během hlasového diktování nebo vyšší spotřebu energie.

Bohužel přišly znovu i některé bolístky z minulosti, ale naštěstí se vše podařilo úspěšně odladit a to i za vydatné pomoci všech testerů, kteří jsou součástí naší mezinárodní komunity. Byl uvolněn bezpočet interních beta verzí a čtyři předfinální sestavení, díky nimž jsme mohli testovat jak nové funkce odečítače, tak i průběžně pracovat na aktualizaci překladu. Právě ty se podílely na finálním zpoždění oficiální aktualizace, jelikož někteří dobrovolníci si svou práci důkladně nepřekontrolovali a v několika lokalizacích se objevily chyby, jež vedly k pádům celé aplikace.

Jak je již několik let dobrým zvykem, česká verze odečítače se opět může pochlubit kompletní lokalizací. ČR je jedna z mála zemí, která v překladech nezaostává, v mnoha jiných státech je to bohužel výrazně slabší. Další zpoždění stabilní verze má pak na svědomí nová funkce scénářů pro hlasové výstupy, jejíž odladění nakonec trvalo velmi dlouho. Jak ze strany autora, tak naší, je kladen obrovský důraz na stabilitu a rychlost celého screen readeru, takže i kvůli tomu nabralo vydání nové verze takové průtahy. Usilovně jsme pracovali, abychom vám mohli přinést komfortní uživatelský zážitek, tak jak tomu v případě Jieshua vždycky bylo.

Výsledek teď můžete sami posoudit.

Představení umělé inteligence

Jistě mnoho z vás sleduje dění kolem čím dál častější implementace AI do různých technologických oblastí a rozličných zařízení. JSR pochopitelně musí v tomto ohledu kráčet s dobou, takže i zde se nyní potkáte se službami umělé inteligence. Konkrétně si je vypůjčila integrovaná aplikace fotoaparátu, jež nově nabízí funkci nesoucí označení „popis obrázku“. Pozor, nepleťte si ji s funkcí rozpoznání obrázku, to je něco zcela jiného. Jedná se o v minulosti používanou metodu, která pochopitelně zůstala zachována.

Popis obrázku ale k rozpoznávání využívá přednosti umělé inteligence, takže se neomezuje jen na popis konkrétního objektu, ale přiblíží vám také detaily okolí a prostředí. Vzhledem k tomu, že v Číně jsou zakázány produkty jako Google Bard nebo Chat GPT, musel se vývojář spolehnout na schopnosti Open AI, za níž stojí pánové Sam Altman, Elon Musk a Greg Brockman.

Pojďme si nyní představit tento projekt slovy umělé inteligence samotné.

„Open AI je nezisková organizace založená v roce 2015. Cílem OpenAI je vytvořit umělou inteligenci pro dobro všech lidí. OpenAI se zaměřuje na výzkum a vývoj v oblasti umělé inteligence, který by mohl být prospěšný pro celou společnost. Tyto aktivity zahrnují výzkum v oblasti strojového učení, deep learningu a dalších oblastí AI, jakož i vývoj open-source software a nástrojů pro výzkumníky a vývojáře. OpenAI také pořádá konference, workshopy a další akce, kde se sdružují odborníci na AI z celého světa, aby se podělili o své znalosti a zkušenosti. OpenAI je nezisková organizace, což znamená, že její výnosy jsou vráceny do organizace k podpoře jejího poslání.“

Jediným jejím omezením v případě Jieshua je kapacita rozpoznávání, kdy je tato schopna realizovat 100 snímků denně. Porovnával jsem například se schopnostmi aplikace Seeing AI od firmy Microsoft a musím říci, že Open AI si vede výrazně lépe! Nejen, že vám dokáže hezky popsat daný předmět, ale navíc přidá poměrně přesný popis okolí a náhled celého prostředí, v němž jste fotografii vyfotili.

Tím však její možnosti nekončí. Můžete taktéž vyfotit osobu a Open AI se už postará o její popis. Dozvíte se například, co má daný člověk na sobě, jak mladě či staře působí jeho vzhled, jestli nosí brýle nebo jak se momentálně tváří. Další možností využití je popis fotografií, které máte ve své galerii. Stačí pouze danou fotku otevřít a skrze menu funkcí (přejetí nahoru a doprava), vyvolat odpovídající volbu. Dostanete se k ní skrze tlačítko „pokročilé menu“.

Samozřejmě je taktéž možné nadefinovat si na popis obrázku specifické gesto, abyste byli ušetřeni zdlouhavého přístupu pomocí menu. Jestliže k funkci přistoupíte skrze pokročilé menu, popis obrázku najdete úplně dole, v horizontální rovině s tlačítkem zrušit. To se nachází vlevo, popis obrázku pak vpravo. Klepnete na něj a pak už pouze čekáte na zobrazení výsledku, jenž je automaticky přečten. Pro vygenerování popisu se používá až 200 jazyků, takže detaily, jež obdržíte, budou pochopitelně v Češtině.

Nevýhodou pro někoho může být skutečnost, že rozpoznávání někdy trvá o něco déle, zpravidla v rozmezí třiceti vteřin až minuty a půl. V případě přímého focení se občas stává, že výsledek není zobrazen, takže je nutné proces zopakovat. Ovšem dost často je na vině vypnutý blesk. Když jej zapnete, mělo by vše proběhnout korektně. Práci s Open AI je však nutné zažít, takže přikládám nový podcast, v němž se můžete sami přesvědčit, jak to celé funguje.

Poslechnout/stáhnout Jieshuo – představení umělé inteligence, formát mp3

Signifikantní navýšení výkonu

Asi netřeba dlouze hovořit o skutečnosti, že Jieshuo patří mezi nejrychlejší odečítače obrazovky pro OS Android. Myslím, že neprohádám, když si dovolím tvrdit, že co se odezvy týče, patří mu jednoznačné prvenství.  Ačkoli se může zdát, že oblast výkonu už není kam posunout, opak je pravdou. Opět bylo dosaženo značného navýšení celkové odezvy.

Tentokrát se autor zaměřil především na dva stěžejní faktory. Tím prvním je schopnost lépe se přizpůsobovat změnám v aktuálním okně, takže JSR na ně mnohem pružněji reaguje. Druhým pak okamžité reflektování překreslení obsahu obrazovky. Zjednodušeně to znamená, že pokud odečítač poskytuje určité hlášení a dojde v tomto čase ke změnám zobrazovaného obsahu, Jieshuo se nezdržuje s dopovězením informace předchozí a okamžitě tak reaguje na aktuální stav.

Toto je výhodné v případě, že potřebujete se zařízením velmi rychle pracovat a požadujete okamžité reakce na měnící se zobrazované informace. Nárůst výkonu tak pocítíte v podstatě při jakékoli činnosti se svým smartphonem. Jestliže budete například rychle otevírat aplikace, nová okna, různé nabídky a podobně, Jieshuo vše bude krásně stíhat. Nyní se tak opravdu nemůže stát, že by vás odečítač v něčem brzdil. Dle mých zkušeností se zařízení chová tak, jako kdyby na něm žádný screen reader vůbec neběžel.

Seznam novinek aktuální verze

  • Opraven problém, kdy v rámci hlasového asistenta vyskakovala chybová zpráva,
  • Optimalizována rychlost automatického rozpoznávání OCR,
  • Opravena chyba na zařízeních Xiaomi, kdy se při zesílení zvuku obsah přehrával dvojitě,
  • Opravena chyba, kdy nemohlo být použito vyhledávání během stahování zdrojů,
  • Opraven problém s neplatným nastavením hlasitosti během čtení delších textů,
  • Opraven problém, kdy malá vnější obrazovka skládacích telefonů nereagovala na prováděná gesta,
  • Opraven problém, kdy některé položky pod fokusem v aplikaci WeChat byly čteny dvakrát,
  • Optimalizováno čtení nápovědných textů v editačních polích,
  • Optimalizováno procházení položek seznamu v aplikaci WhatsApp,
  • Optimalizováno procházení položek seznamu v aplikaci Youtube,
  • Optimalizováno procházení položek seznamu v aplikaci Facebook,
  • Optimalizováno procházení položek seznamu v aplikaci Messenger,
  • Optimalizováno rozhraní rozšiřujících nástrojů a pluginů,
  • Opravena chyba způsobující výjimku aktivace při otevření notifikačního boxu,
  • Přidáno nastavení zpoždění pro druhé gesto v rámci složených gest,
  • Byla přidána další vlákna pro optimalizaci a zrychlení funkcí zálohování,
  • Optimalizováno prostředí cloudových značek,
  • Opravena chyba, kdy se hned po přidání neprojevila povolená oznámení na bílé listině notifikací,
  • Opravena chyba pádu aplikace způsobená nesprávným řetězcem „escape“ v jazykovém nastavení,
  • Opraven problém s nefunkčností rozpoznávání titulků v rámci Androidu 14,
  • Nově je defaultně zakázáno logování a chybové protokoly nejsou automaticky ukládány. Jestliže potřebujete odeslat chybové hlášení, opětovně aktivujte funkci logování v rámci nápovědy a zpětné vazby.
  • Optimalizována funkce fokusu v rámci nabídky v levém dolním rohu hlavního menu,
  • Tlačítko „akce“ (tamtéž), doznalo několika zásadních úprav, nově pod ním najdete tyto položky:
    • Upravit slovník
    • Upravit alias
    • Přidat obsah na černou listinu
    • Zkratky a oznámení
    • Přesunout položku
    • Přidat na plochu
    • Vlastnosti aktuálně zaměřeného objektu
  • Optimalizována funkce přejmenování souborů,
  • Stahování dalších zdrojů bylo upraveno tak, aby podporovalo odeslání souborů dlouhým stisknutím,
  • Optimalizováno zálohování a mazání záznamů časovače,
  • Optimalizace času zálohování a mazání záznamů na serveru,
  • Přidána podpora pro dlouhé / pomalé přejíždění prstem v rámci procházení po znacích,
  • Opraven problém s notifikačním boxem, kdy do něj nepřicházela nová oznámení,
  • Přidána volba pro kontrolu přehrávání zvuku, který indikuje vypršení časového limitu při aktivaci položek zvednutím prstu,
  • Byla obnovena funkčnost kontinuálního rozpoznávání v rámci Jieshuo fotoaparátu,
  • Do pokročilého menu byla přidána funkce popisu obrázku, která využívá umělou inteligenci,
  • Přidáno ovládání rychlosti řeči položením prstu na displej a dlouhým stiskem tlačítek hlasitosti,
  • Přidána funkce restartování a přepínání modulů TTS na zamykací obrazovce položením prstu na displej a dlouhým stiskem tlačítek hlasitosti,
  • Přidáno pokročilé nastavení hlasových výstupů pro různé scénáře. Důležité! Jestliže chcete vědět, jak se tyto tři poslední funkce správně používají, nastudujte si nové kapitoly 14 a 15 v aktualizovaném návodu k aplikaci. Přikládám link na jeho složku, z níž si můžete stáhnout požadovaný soubor;
  • Optimalizováno nastavení zvukových efektů,
  • Optimalizováno vyčítání změn položek pod fokusem,
  • Optimalizována rychlost načítání hlasových knihoven,
  • Přidána podpora zobrazování rozpoznaného textu podle jeho pozice v rámci fotoaparátu,
  • Aktualizován Tencent Cloud engine pro rozpoznávání OCR,
  • Optimalizovány efekty virtuální obrazovky,
  • Optimalizováno zobrazení virtuální obrazovky, když rozpoznáváte text v rámci fotoaparátu a je zohledněna jeho pozice,
  • Optimalizován výkon odečítače,
  • Přidána funkce exportu všech nastavení a zdrojů do zip souboru jedním kliknutím, tato možnost je určena pro komplexní zálohování úplně všeho, včetně složek uživatele. Můžete tak jednoduše konfiguraci přenést do nového zařízení.
    • Jestliže tuto funkci chcete použít, vstupte do pokročilých nastavení a zde klepněte na volbu „nastavení zálohy a obnovení ze souboru“.
    • Tady úplně dole ťukněte na položku „exportovat vše“.
    • Kompletní záloha vašich dat, včetně uživatelského jména a hesla, se uloží do jednoho komprimovaného souboru.
    • Tento obsahuje citlivé údaje, proto jej s nikým dalším nesdílejte! Pozor! Prozatím není přeloženo, bohužel nemáme k dispozici potřebné zdrojové řetězce. Musíte tak využít přímé překladatelské schopnosti odečítače.
    • Pokud si přejete zálohu obnovit na novém zařízení nebo po čisté instalaci Jieshuo, nalistujte vytvořený soubor a ťukněte na něj. Objeví se dialog, jenž se vás dotáže, jak chcete soubor otevřít.
    • Z nabídky dostupných možností zvolte Jieshuo Screen Reader. Tímto okamžikem dojde k importu celého souboru, takže se obnoví všechna vaše nastavení a ostatní stažené zdroje, jež byly v odečítači obsaženy.
    • Pokud zálohu takto obnovíte v rámci stejného zařízení, například po jeho uvedení do továrního nastavení, mělo by dojít i k opětovnému načtení zakoupené licence, jestliže ji máte aktivní.
  • Přidána možnost zastavit hlasité čtení gestem návratu, aniž by bylo nutné vstupovat do režimu automatického čtení otáčení stránek,
  • Přidána funkce editace virtuální obrazovky,
  • Opravena chyba s hlasitým čtením v aplikaci WhatsApp, když je vybrána konkrétní zpráva.

Stažení a instalace

Už dlouho není nutné kvůli rozsáhlejší aktualizaci provádět kompletní reinstalaci aplikace a nejinak je tomu i v tomto případě. Stačí tedy provést klasický update, jenž proběhne zcela bez zásahu uživatele, jestliže máte aktivní volbu pro automatické aktualizace. Pokud tomu tak je, objeví se vám informační okno s aktualizací ihned, jakmile vstoupíte do hlavního nastavení odečítače.

Jestliže tuto funkci aktivovánu nemáte, můžete tak učinit skrze nabídku nastavení aplikace, sekce pokročilá nastavení / další nastavení. Zde tuto volbu reprezentuje hned první dostupné zaškrtávací políčko. Když položku aktivujete, okno s nabídkou nové verze se objeví okamžitě.

Výhodou je skutečnost, že i proces automatické aktualizace byl vylepšen. Nyní totiž nemusíte vybírat, která verze má být stažena. Aktualizační nástroj sám pozná, jakou variantu odečítače používáte a podle ní zvolí odpovídající soubor. Jakmile se tedy objeví okno s dostupností nové verze, stačí jen klepnout na tlačítko ke stažení. To je vše, o zbytek se už postará instalátor. Pokud se vám z nějakého důvodu možnost automatického updatu neobjeví, můžete jej provést manuálně skrze instalační apk soubory. Na tyto přikládám oficiální odkazy pro stažení:

Věřím, že budete s tímto komplexním updatem spokojeni. Čekání bylo tentokrát opravdu dlouhé, avšak výčet novinek je impozantní, takže se rozhodně vyplatilo.

Enjoy this new official release!


Článek původně vyšel na webu androidbezzraku.wordpress.com.



AndroidJieshuo


Matěj Plch
Jmenuji se Matěj Plch a jsem od narození nevidomý. Deset let jsem se intenzivně věnoval propagaci mobilní platformy Google Android, kterou sám používám a podařilo se mi její přístupnostní nástroje rozšířit mezi české uživatele.