Jak jsem díky inteligentní asistenční aplikaci ke skvělé kávě přišel? Srovnávací test aplikací Envision AI a Seeing AI

Jmenuji se Vladimír Dvořák a zabývám se informačními a komunikačními technologiemi. A protože jsem nevidomý, rád bych se s vámi podělil o zkušenosti s aplikací Envision AI určenou pro chytrý mobilní telefon iPhone firmy Apple.

Milí čtenáři, ne, určitě se nebojte, že bych se v následujícím textu zabýval kulinářskými záležitostmi, od toho tu Pelion určitě není. Ale otázka mi poslouží, abych vám přiblížil, co mne nejvíce motivovalo si aplikaci Envision AI pořídit.

Téměř před půl rokem jsem se rozhodl, že si pořídím kávovar, který bude nejen vařit skvělou kávu, ale nabídne mi v cenové kategorii to nejlepší. Ano, nabídnul, ale k tomu všemu mi nabídnul i svůj aktivní digitální display. A ejhle, problém byl na světě.

Co po mě vlastně chce, co mi říká? No, to byla ta otázka, že?

Několik týdnů jsem zkoušel různé aplikace pro rozpoznávání textů, ale žádná z nich mne nezaujala tak, abych řekl, že prostřednictvím takové aplikace jsem schopen rychle a v reálném čase kávovar používat. Byl jsem z nastalé situace docela rozmrzelý. Po čase se ale na mne usmálo štěstí, když jsem v App Store narazil na aplikaci Envision AI, jež je určena pro chytré telefony firmy Apple.

Srovnávací test aplikací Envision AI a Seeing AI

Datum testu – 21. 01. 2019

testováno:

  1. operační systém – iOS – 12.1.2
  2. iPhone XS – vybavený duálním fotoaparátem se stabilizací obrazu

1. Aplikace Envision AI

Prostředí programu je české. Aplikace je plně dostupná pro hlasový výstup Voice Over a má klasické uspořádání. To znamená, že v dolní části obrazovky jsou čtyři záložky, a to tyto:

  1. Text
  2. Obecné
  3. Rozpoznávání předmětů
  4. Nápověda

Na každé záložce jsou tlačítka pro ovládání.

Níže jsou vypsány jednotlivé funkce, které aplikace nabízí:

  1. Karta – Text
    1. Lupa
    2. Zapnout průběžné čtení textu
    3. Přečíst rukou psaný text
    4. Vyfotit a přečíst dokument
  2. Karta – Obecné
    1. Popsat scénu
    2. Rozpoznat barvy
    3. Naskenovat čárový kód
  3. Karta – Rozpoznávání předmětů
    1. Nalézt vlastní předměty
    2. Najít obecné předměty
    3. Naučit
  4. Karta – Nápověda
    1. Přečíst návod
    2. Zpětná vazba
    3. Zažádat o hovor
    4. Nastavení

Funkce – Lupa

Umožňuje promítání snímané předlohy kamerou telefonu na obrazovku zařízení. Prostřednictvím posuvníku lze volit velikost obrazu. Dále je možné nastavit inverzní barvy.

Zobrazení není moc kvalitní, v průběhu testu nedocházelo k automatickému přisvícení snímané předlohy stran fotoaparátu.

Funkce – Průběžné čtení textu

Funkce dobře odečítá tištěný text, a to v reálném čase. Tedy po namíření kamery telefonu na předlohu začne hlasový výstup téměř okamžitě číst samotný text. Navíc, u telefonů, které mají stabilizaci fotoaparátu, je možné odečítat i text ze vzdálenější plochy, jako jsou tabulky na zdi či dveřích.

Funkce může posloužit v případě odečítání obalů potravin, kosmetiky apod.

Je možné v reálném čase odečítat i aktivní display či text na obrazovce televize nebo monitoru počítače.

Funkce – Přečíst rukou psaný text

Funkce vyfotografuje předlohu a rozpozná…

Jako předlohu jsem měl kvalitně rukou psaný text, aplikace jej rozpoznala v zásadě dobře…

Funkce je schopna rozpoznat také tištěnou předlohu.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Vyfotit a přečíst dokument

Funkce slouží pro rozpoznávání tištěné předlohy. Navíc, je vybavena aktivním sledováním předlohy, tedy, říká uživateli, zda je předloha v zorném poli fotoaparátu. V případě, že předloha není zcela vyditelná, upozorní, jaké rohy jsou skryté.

Platí, že, když je předloha plně vyditelná pro fotoaparát, aplikace automaticky v tu chvíli předlohu vyfotí a začne rozpoznávat. Prostřednictvím funkce je možné fotografovat více dokumentů najednou.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Popsat scénu

Funkce vyfotografuje a popíše scénu.

Dle mého testu byly situace, zachycené na fotografiích, dobře popsány.

Pro dobré rozpoznání je vhodné kvalitní osvětlení.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Rozpoznat barvy

Funkce je určena pro rozpoznání barev. Rozpoznávání probíhá ve dvou možných režimech:

  1. Základní – zde aplikace rozpoznává barvy z palety 30 odstínů.
  2. Popisné – zde aplikace rozpoznává barvy v paletě 950 odstínů.

Ovšem, dle mého testování je rozpoznávání opravdu jen hrubě orientační. Můžeme se odvolat na srovnání s jinými aplikacemi, které mají podobnou funkci, kde je úspěšnost přesného určení barvy také jen přibližná.

Faktorem lepšího výsledku je kvalitní osvětlení a výkonnost samotného fotoaparátu.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Naskenovat čárový kód

Funkce je schopna rozpoznat čárové kódy např. na obalech potravin. Je však nutné pro zachycení kódu fotoaparátem pečlivě prozkoumat celou plochu obalu. V případě, že fotoaparát čárový kód zachytí, začne aplikace vydávat zvuk značící viditelnost kódu. Po čase dostaneme informaci o názvu zboží či takovou, že čárový kód nebyl rozpoznán.
Jestliže je kód rozpoznán, mohu si z další nabídky zjistit např. jeho složení, dostupnost či zobrazit produktovou stránku.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Nalézt vlastní předměty

Funkce se využívá pro rozpoznání vlastních předmětů, které lze definovat prostřednictvím funkce – Naučit.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Najít obecné předměty

Funkce se používá pro popis zaměřeného předmětu. Úspěšnost rozpoznání je trochu diskutabilní, protože, např. PC sestavu, označila jako hudební nástroj.

Na druhou stranu, rozpoznání nádobí či popis scény např. místnost apod., toto probíhá uspokojivě.

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Naučit

Funkce nabízí možnost naučení konkrétního obličeje a dále konkrétního předmětu.

Pro naučení obličeje je nutné vyfotografovat cca 10 snímků, zde je možné využít pro záznam zadní či přední fotoaparát.

Po nafocení obličeje či předmětu se výsledek uloží, je nutné poté přidat vlastní popisek. Konkrétní uložený výsledek je dostupný v knihovně předmětů a obličejů, kde je dostupná i jeho editace…

Funkce je dostupná tehdy, kdy je telefon připojen na internet.

Funkce – Nápověda / Přečíst návod

Funkce Přečíst návod je dostupná ve dvou jazycích, a to v Angličtině a Němčině. Dále je zde možnost přepnout se přímo na internetové stránky výrobce.

Funkce – Zpětná vazba

Funkce nabízí prostřednictvím formuláře odeslat komentář výrobci.

Funkce – Zažádat o hovor

Funkce nabízí možnost po vyplnění telefonního čísla uživatele zpětné zavolání od výrobce aplikace.

Volba – Nastavení / Rozpoznávání textu offline

Tuto volbu je možné buď zapnout či vypnout. Při zapnuté volbě je možné rozpoznávat text ve funkci Zapnout průběžné čtení textu bez přístupu na internet.

Volba – Automatické rozpoznání jazyka

Volba umožňuje rozpoznávání v ostatních jazycích. Při mém testu rozpoznávání, ve funkci – Zapnout průběžné čtení textu, však docházelo k občasných chybám, a to takovým, že byl někdy český text čten např. anglicky apod. Problém se vyskytoval u čtení etiket potravin s více jazyčným textem.

Volba – Řeč

Zde je možné nastavit rychlost čtení rozpoznané předlohy a také hlas, který bude výsledek číst.
Pozor, toto nastavení neovlivňuje nastavení samotného Voice overu v operačním systému. Vztahuje se jen a pouze na hlas využívaný pro čtení rozpoznaného textu v aplikaci.

Volba – Rozpoznávání barev

Zde se dá nastavit úroven, dle které bude docházet k určení barvy viz výše… Zda bude barva rozpoznána v 30 nebo 950 odstínech.

Pro samotné využívání programu je nutné se přihlásit uživatelským účtem. Uživatelský účet má podobu mailové schránky. Po stažení aplikace a následném přihlášení prostřednictvím mailového účtu, má uživatel k dispozici 14ti denní zkušební lhůtu na testování. V průběhu této lhůty jsou dostupné všechny výše popsané funkce…
Po naplnění 14ti denní lhůty je možné aplikaci odinstalovat či zakoupit licenci.

Licence může být:

  1. celoživotní – cca 5 200 Kč
  2. roční – cca 1 090 Kč
  3. měsíční – cca 139 Kč

Poznámka – samotnou aplikaci, v plné verzi, jsem zakoupil v čase Vánoc, kdy byla zlevněna přibližně na 3 200 Kč.

Aplikace je dostupná v App Store a instaluje se běžným způsobem, dle pravidel Apple.

Výhody programu

  1. Dobré odečítání v reálném čase se správnou českou diakritikou.
  2. Při fotografování předlohy dojde k automatickému vyfocení tehdy, kdy je celý dokument v zorném poli kamery.
  3. Obstojná knihovna s čárovými kódy výrobků.
  4. V zásadě rychlé rozpoznání textu.

Nevýhody programu

  1. Pořizovací cena.
  2. Program nemá vlastní OCR knihovny pro rozpoznání textu. Vše se odehrává odesláním vyfocené předlohy na server. Toto neplatí pro funkci Průběžné čtení textu, pro které si mohu v nastavení zvolit rozpoznávání offline.
  3. Pro správné rozpoznání textu je nutné mít předlohu správně směrovanou vůči fotoaparátu. Tedy, když je předloha vzhůru nohama, nedojde k dobrému rozpoznání.
  4. Neúplně dobré rozpoznávání obecných předmětů.
  5. Neúplně spolehlivé rozpoznávání barvy předlohy.

Poznámka – pro kvalitní rozpoznávání textů doporučuji fotoaparát se stabilizací obrazu.

Aplikace – Seeing AI

Pro test platí tyto podmínky:

  1. operační systém – iOS – 12.1.2
  2. iPhone XS – vybavený duálním fotoaparátem se stabilizací obrazu

Aplikace se nabízí jen v anglické mutaci. Aplikace je plně dostupná pro hlasový výstup Voice Over.
Uspořádání ovládacích prvků aplikace je odlišné vzhledem k aplikaci Envision AI.

Prostředí aplikace vypadá následovně:

  1. horní část obrazovky – V levé části se nachází tlačítko Menu, v pravé části obrazovky je tlačítko Quick Help.
  2. střední část – Zde se nachází tlačítko Resume Announcements / Pause Announcements
  3. spodní část – Zde se nachází přepínač Channel, švihem jedním prstem vzhůru či dolu jím měním funkce, které jsou tyto:
    1. Short Text
    2. Document
    3. Product
    4. Person
    5. Currency
    6. Scene Preview
    7. Color Preview
    8. Handwriting Preview
    9. Light

Funkce – Short Text

Funkce odečítá v reálném čase text, na který namířím fotoaparát telefonu. Odezva je velmi rychlá a v zásadě přesná.
POZOR – funkce není schopna rozpoznávat specifické české znaky. Tedy, jestliže se v textu specifické české znaky vyskytují, dojde k jejich úplnému vynechání a hlasový výstup je nepřečte.

Příklad: Jestliže by mělo dojít k přečtení slova čeština, bude přečteno pouze E tina.

Funkce se spouští a vypíná tlačítkem Resume Announcements / Pause Announcements.

Funkce – Document

Funkce je určena pro vyfocení a následné rozpoznání tištěného textu.
Pro správné focení je zde pomocná hlasová navigace, která v anglickém jazyce sděluje, jestli je dokument zcela vyditelný pro fotoaparát. V případě, že dokument není zcela vyditelný, komentář označí části / rohy, které jsou neviditelné.

V případě, že je dokument zcela vyditelný pro fotoaparát, program automaticky předlohu vyfotografuje.
Výsledek focení je odeslán na server pro samotné rozpoznání.
V této funkci se zdá, že jsou plně zachovány české specifické znaky. Tedy, český text je čten v zásadě správně.

Funkce – Product

Funkce slouží ke skenování produktových značek / kódů. V průběhu testu se mi nepodařilo úspěšně naskenovat značku žádnou.

Zkoušel jsem čajové produkty, u kterých jsem byl v rozpoznání jednou úspěšný s aplikací Envision AI.

Funkce – Person

Funkce slouží k focení obličeje.

Pro fotografování můžeme zvolit přední či zadní fotoaparát.

Po stisku tlačítka Take Picture dojde k vyfocení obličeje. Před fotografováním je uživateli hlasem podána informace, zda se nějaká tvář v zorném poli fotoaparátu nachází.

Po vyfocení obličeje je okomentován věk foceného, dále emoce a případně barva vlasů.

Výsledek je možné uložit do knihovny fotografií.

Funkce – Currency

Funkce slouží k rozpoznávání bankovek. Je možné rozpoznat tyto bankovky:

  1. Rupie – Indie
  2. Libra – GB
  3. Dolar – Kanada
  4. EURO
  5. Dolar – USA

Pro test jsem měl EURO bankovky. Ty byly rozpoznány správně.

Funkce – Scene Preview

Funkce slouží k rozpoznání a popsání scény. Zkoušel jsem fotit PC sestavu na stole. Komentář, který je v anglickém jazyce, byl v zásadě přesný. Opět platí, že fotografii scény je možné uložit do knihovny.

Funkce – Color Preview

Funkce je určena pro pojmenování barvy. Po namíření fotoaparátu na předmět dojde k popsání barvy. Opět platí, že určení barvy je velmi orientační a nepřesné.

Funkce – Handwriting Preview

Funkce je označena jako experimentální. Slouží k rozpoznání rukou psaného textu. Tedy, po stisku tlačítka Take Picture, dojde k samotnému rozpoznání. Výsledek byl uspokojivý.

Funkce – Light

Funkce slouží pro určení intenzity světla. Tedy, jestli je světlo aktivní, program jej označí vyšším tónem. Jestliže je světlo vypnuté, program vydává velmi nízký tón.

Položka – Menu

Tato položka zahrnuje nastavení programu, jako je:

  1. Nastavení
    1. Nastavení měny pro rozpoznávání bankovek
    2. Konfigurace 3D Touch jako zkratková klávesa
    3. Nastavení osvětlení – vypnuto / zapnuto
  2. Řeč
    1. Nastavení hlasu – neobsahuje češtinu
    2. Nastavení rychlosti řeči
  3. Procházení fotografií
    1. Zda přednostně ukazovat posledně nafocené snímky

Položka – Quick Help

Obsahuje zkratkové klávesy pro ovládání a videonávod.
Dále je zde možné napsat zpětnou vazbu výrobci a přečíst si nápovědu v anglickém jazyce.

Výhody programu Seeing AI

  1. program je k dispozici zdarma
  2. obstojné rozpoznávání textu ve funkci Dokument
  3. funkce detekce světla
  4. dobré popisování scén ve funkci – Scene Preview

Nevýhody programu Seeing AI

  1. Neschopnost rozpoznávat specifické české znaky ve funkci – Short Text
  2. Anglické prostředí
  3. Nedobré rozpoznávání předmětů ve funkci Product
  4. Program neobsahuje OCR knihovny pro rozpoznávání textu

Vážení čtenáři, pokud jste dočetli až sem, děkuji vám velice za váš zájem a přeji vám, ať vám nové technologie usnadňují život třeba tak, jako mně výše popsané aplikace.



AppleEnvision AIiPhoneSeeing AI


Vladimír Dvořák
Jmenuji se Vladimír Dvořák a zajímám se o svět digitálních technologií. Mezi mé koníčky patří hlavně cestování, lyžování, historie 20. století, inteligentní hudba, četba faktografie, sledování dokumentů a další.