Uprostřed obrázku je nakreslen mobil s nápisem Seeing AI. Kolem je mnoho věcí denní potřeby, jako knihy, budík, nůžky, tužka, hrnek s kávou, květina v květnináči... Obrázek je vytvořen pomocí AI.

Seeing AI – vzhled a funkce aplikace v roce 2025

Aplikace Seeing Ai dostala v prosinci roku 2020 nový kabátek, a to v podobě lokalizace do českého jazyka a některé nové funkce. Od té doby prošla dalšími dílčími změnami a vylepšenými funkcemi. A tak je čas si aplikaci opět připomenout, jelikož její funkce mohou být dobrými pomocníky při sebeobsluze zrakově postiženého.

Obecně

Tato aplikace je produktem společnosti Microsoft, která za ní dostala ocenění za nejpřínosnější počin v oblasti asistivních technologií. Tato aplikace pomáhá lidem se zrakovým postižením získávat informace z okolí pomocí fotoaparátu. Používá umělou inteligenci ke čtení textu, rozpoznání objektů, barev či lidí. Aplikace je dostupná v českém AppStore a Google Play. Aplikace je bezplatná.

Po stažení

Po prvním otevření aplikace po instalaci se na obrazovce objeví pár stránek průvodce aplikace, je třeba povolit přístup k fotoaparátu a odsouhlasit podmínky aplikace a aplikace se nám otevře. Aplikace pozná, je-li VO vypnutý, pak informace hlásí svým hlasem.

Když ji otevřeme, tak v levém horním rohu je Nabídka (menu) – zde se nachází položky jako Procházet fotky, Nápověda, Váš názor, Nastavení a O aplikaci.

Procházet fotky – když nějakou fotku otevřeme, tak aplikace analyzuje osoby, objekty, text a polohu. Je pak možné si přečíst, co se na fotce pravděpodobně nachází, je-li tam text, co tam je a ze kdy fotka analyzovaná je.

Nastavení – měny bankovek, které budou rozpoznány, je zde blesk kamery (Svítilna), lze zde vybrat hlas (Řeč), lze zde přeuspořádat kanály či nakonfigurovat zkratky Siri či Haptic Touch.

Převážnou část obrazovky máme pohled přes aktivní fotoaparát. Dříve ve spodní části obrazovky byly funkce (kanály), které aplikace nabízí.

Vzhled

Aktuálně je aplikace vylepšena a proběhly malé kosmetické změny.  Nyní jsou k dispozici 3 položky s dalšími funkcemi: Číst, Popis a Více.

Číst – karta na čtení textu v okolním prostředí a tištěných dokumentech. Tato položka sdružuje dřívější kanály Krátký text a Dokument. V náhledu fotoaparátu (ve spodní části) máme tlačítka: Zarovnání dokumentu vyp./zap. – když zvolíme tuto volbu, pak VO hlásí, zda jsou nad textem viditelné okraje, automaticky zachytí text, hlásí, abychom se nehýbali. Další tlačítka – Pořídit obrázek, Rozpoznává se čeština (měníme zde jazyk rozpoznaného textu).

Dáme-li fotoaparát (zařízení) nad text, pak VO čte obsah textu v reálném čase bez nutnosti vyfocení.

Když předlohu vyfotíme pomocí tlačítka Pořídit obrázek, následně probíhá zpracování nasnímané předlohy. Když se předloha rozpozná, tak její obsah vidíme na monitoru telefonu. Můžeme si jej číst šviháním, jsou to výsledky snímání. Také lze využít gesto přejetím dvěma prsty odshora dolů.

Rozpoznání obsahu předlohy probíhá velmi rychle. Výsledný text si pak můžeme nechat Přehrát (levý dolní roh) či Sdílet (pravý dolní roh). Sdílet můžeme jako obrázek, jako text či HTML.

U rozpoznaného textu máme ještě v pravém horní rohu tlačítka Přidat stránku (pořídíme další vyfocení) a Více (informace os stránce či odstranit stránku/stránky).

Popis – karta na rozpoznání prostředí, fotek a multimédií. Tlačítka, a to Rozpoznávání tváře (lze si známé tváře uložit), Přepnout na přední kameru a Procházet fotky. Vyfotíme-li to, co je před námi dostaneme popis podobný Be My AI. Je třeba zdůraznit, že popis v Seeing AI se hodně zlepšil, co do kvality, tak do kvantity. U prozkoumané fotky lze pak provést její další průzkum prstem, uložení či sdílení.

Prozkoumat fotku – prozkoumat prvky na fotce – prstem přejíždíme prvky na fotce a slyšíme jejich názvy, rozpoznávání není vždy přesné, na fotce aplikace identifikuje i text (např. na fotce našla aplikace osobu, lampu, počítač), VO také hlásí, kolik položek zjistil ke prozkoumání.

Když fotografii vložíme z fotoaparátu, popis proběhne stejně. Pokud je na fotografii i případný text, popis obsahuje i jeho popis, např. na fotce je ruka držící modrou plechovku s nápisem Pepsi limitovaná edice a další informace o příchuti.Aplikace dříve měla kanál Scéna, který je nyní obsažen zde v Popisu. Vyfotíme prostředí před sebou a aplikace pomocí umělé inteligence popíše scénu jako celek, posloucháme, co aplikace popíše. Popis je dosti detailní a popisný. Opět můžeme procházet obsah fotky prstem a zjišťovat objekty na fotce.

Seeing AI – umí též nově popsat obsah natočeného videa. Využijeme na to též tlačítko Nabídka, zde nás zajímá položka Procházet fotky (lze rovnou z nabídky Popis). Dostaneme se na obsah naší galerie fotek, kde vybereme to, co chceme rozpoznat. VO hlásí, zda se jedná o fotku, snímek obrazovky či video a čas a datum pořízení. Vybrané poklepeme. V dolní liště pak vidíme tlačítko Popis (u videa) a Odstranit. Rozpoznání trvá déle, i když má video třeba osm vteřin. Je lepší nechat rozpoznat videa max 1, 5 minuty. V horní části obrazovky běží video, pod ním je text, který zrovna popisuje to, co se děje na videu. Jak se video posouvá a mění, tak i se mění text pod videem s aktuálním popisem. Pod videem jsou ovládací prvky – přeskočit zpět, přehrát a přeskočit dopředu. Takto si můžeme v textu přehrávat všechny části videa a procházet si jeho popis.

Více – pod tímto tlačítkem se aktuálně, nám již známé, kanály. Pohybuje se zde šviháním jedním prstem odshora dolů, tuto sekci hlásí VO jako Kanál. Nad kanály zůstávají tlačítka Číst, Popis a Více.

V levém horním rohu je stále menu Nabídka a v pravém horním rohu kanálu je tlačítko Rychlá nápověda ke každé z funkcí.

Kanály

1. Produkt – výrobky

Držíme kameru nad čárovým kódem, aplikace sama kód zachytí, když budeme produktem otáčet. Pípání signalizuje, že se v blízkosti nachází čárový kód. Čím je rychlejší, tím je kód blíže. Lepší začít se skenováním z delší vzdálenosti. Rozpozná čárové i QR kódy. Když aplikace kód najde, vysloví název produktu, někdy je však nenalezeno. Když budou k dispozici jiné informace o produktu, bude k dispozici tlačítko Další informace. Lze takto třídit produkty v domácnosti k sebeobsluze, ať v kuchyni, tak např. v koupelně.

2. Osoba

Aplikace pozná, když je v hledáčku osoba a pak podá o ní informace – 40letý muž, hnědé vlasy, vypadá neutrálně – podrobnější informace podá až poté, co uděláme fotku. Jinak aplikace poví, kolik obličejů je v prostoru a v jaké vzdálenosti. Lze i přepnutím kamery pořídit selfie.

Nad seznamem kanálů je tlačítko Pořídit obrázek – vyfotíme sebe či někoho před námi. Vpravo od tohoto tlačítka je přepnutí kamery přední/zadní, vlevo je tlačítko Rozpoznávání tváře – jsou to rozeznatelní lidé, které jsme si uložili. Vidíme zde seznam lidí uložených na rozpoznání. Pravý horní roh – Přidat – začneme ukládat osobu. Namíříme na osobu hledáček fotoaparátu, uděláme tři snímky, pak nám vyjede textové pole, kam napíšeme jméno osoby, ta se nám posléze objeví v seznamu osob. Když na uloženou osobu pak namíříme hledáček, tak nám VO poví, kdo to je, aniž bychom jej museli fotit, stačí namířit. Pomocí tohoto kanálu můžeme snímat lidi, dozvíme se počet osob, jak se tváří. Když se do záběru dostane osoba, kterou jsme si uložili, aplikace ohlásí její jméno. Aplikace také nabídne odhad charakteristik a výrazů tváře osob. Levý horní roh kanálu je tlačítko Nabídka – kde je možnost Procházet fotky v našem zařízení – vybereme fotku, dozvíme se datum a čas fotky, místo, ale hlavně popis dané osoby. Můžeme takto zjistit, kdo se na fotkách nachází, popíše, i když je více osob na snímku.

3. Měna – rozpoznání bankovek

Aplikace umí USD, brazilský real, britské libry, indické rupie, japonské jeny, kanadské dolary, turecké liry či např. eura, Českou měnu aplikace neumí. Namíříme kameru na bankovku a uslyšíme hodnotu. Nerozliší skutečnou měnu a padělek.

4. Barva

Pouze přejíždíme nad objekty, nic nefotíme a aplikace poví, co je to za barvu. Barvy jsou závislé od množství světla z okolí, takže na jednom objektu může hlásit různou barvu, také záleží na vzdálenosti, jak přiložíme zařízení nad objekt. Výsledky jsou spíše orientační nežli objektivní.

5. Svět

Je k dispozici na zařízeních s LIDARem (od iPhone 12) a iOS 14, umožňuje prozkoumávat neznámý prostor ve 3D. Využívá k tomu prostorový zvuk, pomocí sluchátek uslyšíte názvy objektů z míst, na kterých se v místnosti nacházejí. Můžeme rozšířit tím svůj pohyb za pomoci bílé hole. Lze vytvořit trasu z bodu A do bodu B, a pak se po ní necháme navigovat pomocí zvuků. Jde to pouze uvnitř budov, aby se měl zvuk od čeho odrážet, ale i tak by to mohlo najít využití např. pro ty, co se po oslepnutí neumějí zorientovat doma. Vytvoříme výchozí bod, ten detailně nasnímáme pomocí telefonu, pak držíme telefon před sebou a jdeme trasu, stále snímáme prostor před sebou, když jsme na konci, pak uložíme a pojmenujeme trasu. Trasu pak lze sdílet s ostatními. Je třeba mít sluchátka, když jdeme po trase správně, máme zvuk v pravém i levém sluchátku, když se odchýlíme, pak jedno sluchátko je hluché to, které má zvuk, v tom směru je třeba vrátit se na trasu. Po částech trasy slyšíme zvuk, který signalizuje, že jdeme dobře. Na konci trasy zvuky utichnou.

6. Najít moje věci

Lze vyhledávat osobní věci (taška, klíče aj.). Máme zde tlačítka Naučit nový objekt a Moje objekty (seznam našeho uloženého). Ukládání probíhá tak, že nás aplikace naviguje při vytváření tří videí na různých površích, kde snímáme objekt, který si chceme uložit. Nejprve si jej pojmenujeme a pak probíhá snímání. Aplikace procesem provede, jde to poměrně snadno, když se držíme pokynů. Když proběhne uložení, pak na našem uloženém objektu dáme Najít. Přejíždíme náhledem fotoaparátu po místnosti, když se v záběru objeví náš objekt, tak zvukem dostaneme pokyn, že se objekt přibližuje a zhruba v jaké je vzdálenosti. Když jsme úplně u něj, tak obdržíme hlášku, že byl objekt úspěšně nalezen.

7. Světlé (světlo)

Zjišťujeme míru osvětlení kolem nás, výška tónu závisí na tom, kolik světla telefon vidí. Čím více světla, tak je tón vyšší.

Závěrem

Vždy je třeba si pohlídat, v které kartě jsme, tedy Číst, Popis či Více. Každá z karet má své funkce, díky kterým můžeme velmi dobře dostat obsah tištěné předlohy v reálném čase, ale i detailněji vyfocením předlohy. Můžeme si nechat popsat scénu před námi, lidi kolem nás, ale i obsah videa. A v neposlední řadě lze vybírat s dalších sedmi položek s doplňujícími funkcemi. Kde si lze uložit nejen osoby, ale i naše frekventované předměty, které díky aplikaci lze hledat při jejich ztrátě např. po bytě.

Ať pracujeme s jakýmkoli kanálem, tak v levém horním rohu máme tlačítko Nabídka, kde jsou možnosti, které se nemění. Procházet fotky – můžeme si tedy kdykoli nechat rozpoznat, co je na naší fotce/videu v galerii. Aplikace popíše, zda je to scéna, zda je tam člověk, jaké pohlaví, jaké má vlasy, poloha fotky, stáří žena a výraz tváře. U všech kanálů vpravo nahoře je tlačítko Rychlá nápověda, kde najdeme pokyny k danému kanálu, co dělá a jak se s ním pracuje.

Aplikace obsahuje hodně funkcí, tudíž není třeba instalovat více aplikací, abychom měli všechny tyto funkce pohromadě, aplikace je sdružuje v jednom. Je jednoduchá a přehledná, může být dobrým a praktickým pomocníkem.


Článek vyšel původně na webu blindicka.com. Redakčně upraveno.



Seeing AI


Linda Albrechtová
Jmenuji se Linda Albrechtová. Jsem od narození prakticky nevidomá, a tak využívám aktivně různé asistivní technologie od základní školy. Jsem absolvent Západočeské univerzity. Pracuji v plzeňském krajském středisku Tyfloservisu, předávám klientům své zkušenosti se zrakovým hendikepem, vyučuji obsluhu kompenzačních pomůcek.