Okosszemüveg mint segédeszköz: új alkalmazások érkeznek a Meta Ray-Ban platformra

A Meta Ray-Ban szemüvegek körül egyre több akadálymentesítési alkalmazás jelenik meg – a tárgykeresőtől a navigációig. Közben egy brit fejlesztő megmutatta, hogy a vakok is versenyezhetnek.

Az okosszemüvegek piaca évek óta ígérget, de a kézzelfogható eredmények sokáig várattak magukra. A Meta Ray-Ban szemüvegek esetében viszont most érzékelhetően felgyorsultak a fejlesztések, különösen az akadálymentesítés terén. A Meta megnyitotta az SDK-ját külső fejlesztők előtt, és ez néhány hónap alatt valóságos ökoszisztémát kezdett kinevelni a platform köré. A Double Tap podcast legutóbbi adásában Stephen Scott és Sean Preece ezeket az újdonságokat járta körül, kiegészítve saját tesztelési tapasztalataikkal.

A vakok és gyengénlátók számára a kézmentes technológia nem kényelmi funkció, hanem alapvető szükséglet. Egy szemüvegbe épített kamera és hangszóró olyan felhasználási módokat tesz lehetővé, amelyekre a kézben tartott telefon nem képes – vagy csak kényelmetlenül. A Meta Ray-Ban második generációs szemüvege már rendelkezik kamerával, mikrofonnal és hangszórókkal, amelyek kombinációja ideális alap az akadálymentesítési alkalmazásokhoz.

Fejlesztők versenye az SDK körül

A Meta az SDK megnyitásával lényegében platformmá tette a Ray-Ban szemüveget. Az alkalmazások a Meta AI appon keresztül kapcsolódnak az eszközhöz – hasonló modellben, mint ahogy korábban a Be My Eyes integrálódott. A Meta kontrollálja, hogy melyik alkalmazás kerülhet a platformra, ami egyszerre jelent minőségbiztosítást és szűk keresztmetszetet. A podcastműsorvezető szerint a Meta AI appon belül egy akadálymentesítési almenü fog megjelenni, ahol a Be My Eyes mellett az új alkalmazásokat is elérik majd a felhasználók – hasonlóan ahhoz, ahogy most a Shazam vagy az Apple Health kapcsolódik a rendszerhez.

Több ismert szereplő is bejelentette, hogy fejleszt a platformra. A Microsoft Seeing AI megjelenése várható, bár konkrét dátumot egyelőre nem közöltek. Scott reményei szerint a Seeing AI elsősorban pontos, szó szerinti szövegfelismerést (OCR) fog nyújtani a szemüvegen – valami olyat, amit a jelenlegi AI-alapú megoldásoktól hiába vár. Az Aira – amely élő emberi segítőkkel dolgozó szolgáltatás – március végére ígérte az indulást; ezt Shelly Brisbinnek erősítették meg. A HumanWare mesterséges intelligenciával támogatott navigáción dolgozik, ami a cég Braille-kijelzős eszközei mellé teljesen új irányt jelent.

Két kevésbé ismert fejlesztő is feltűnt. A ScribeMe (nem összekeverendő a Scribe nevű alkalmazással) élő mesterségesintelligencia-asszisztensként működne: PDF-ek és dokumentumok akadálymentes feldolgozását ígéri, és a tervek között szerepel tévéműsorok hangos leírása is. Ez utóbbi külön érdekes kérdéseket vet fel: a hagyományos audiodeszkripcióval ellentétben az AI-alapú leírás valószínűleg nem tudná megkülönböztetni a párbeszédes jeleneteket a leírást igénylő részektől, így folyamatosan közvetítene – ami bizonyos műfajoknál, például akciójelenetekben, inkább zavaró lehetne, mint hasznos. A bejelentés egyelőre csak a Facebookon jelent meg, a cég weboldalán nincs róla információ, ami óvatosságra int.

A másik újdonság az Oorion nevű alkalmazás (a neve két O-val írandó), amelyről lentebb részletesen szó lesz.

Tárgykeresés hangjelzésekkel: az Oorion alkalmazás

Az Oorion az eddig bemutatott alkalmazások közül a leginkább kézzelfogható. Elsősorban beltéri használatra tervezték, két fő funkciója van: tárgyak azonosítása és megkeresése.

Jenine Stanley 2025 januárjában tartott demója alapján az alkalmazás 86 előre definiált objektumot ismer fel – mindennapi háztartási tárgyakat, a hátizsáktól a buszmegállóig. Ezen túl szöveget is keres: a bemutatón például aszpirint kerestek palackok feliratai között, és az alkalmazás nemcsak megtalálta a sárga flakon feliratát, hanem a hatóanyag mennyiségét (81 milligramm) is felolvasta. A különlegessége, hogy személyes tárgyakat is be lehet tanítani: Stanley a demóban a vakvezető kutyája pórázát tanította meg az alkalmazásnak, és azt tervezte, hogy a kutyahámot is hozzáadja, mert szállodai szobákban rendszeresen elveszíti. Amikor a felhasználó egy tárgyat keres, az Oorion hangjelzésekkel vezeti oda – egyre gyorsuló pittyegéssel jelzi a közeledést, méterben mondja a távolságot, és a bal vagy jobb fülbe irányított hanggal mutatja az irányt.

Sean Preece a podcastban beszámolt saját tesztelési tapasztalatairól. A bétaverziót kapta meg a szemüvegre, és – az eredeti tervezési céllal ellentétben – szabadtéren próbálta ki akadályészlelésre. A „Tell me if there’s any obstacles directly in front of me” parancsot használta, és meglepően jó eredményeket kapott. A szemüveg futólag jelezte, ha az előtte lévő járda szabad, figyelmeztetett a parkoló autókra jobbról és balról, megbecsülte a járdaszegélyek magasságát, és arra is felhívta a figyelmet, hogy az út lejtős és nedvesnek tűnik. Néhány nap használat után Preece annyira megbízhatónak ítélte, hogy minden reggeli kutyasétánál bekapcsolja, a VoiceVista navigációs alkalmazással együtt. A két alkalmazás jól kiegészíti egymást: a VoiceVista a tájékozódásban, az Oorion a közvetlen környezet feltérképezésében segít.

Beltérben is kipróbálta: szobáról szobára haladva az alkalmazás automatikusan azonosította a környezetet – konyhában a berendezési tárgyakat, nappaliban a tévét és a kanapét –, anélkül, hogy minden egyes helyiségben külön kérdezni kellett volna. Scott arra is kitért, hogy kipróbálta az ajtókeresés funkciót kültéren, ami az úgynevezett „utolsó tíz méter” problémára – vagyis a célpont közvetlen közelében történő tájékozódásra – adhatna megoldást.

A platformgondolkodás korlátai

Colin Hughes, aki szintén a podcast közösségéhez tartozik, fontos kérdést vetett fel: miért szinte kizárólag vakok és gyengénlátók számára készülnek ezek az alkalmazások? Hughes izomsorvadással él, és rámutatott, hogy a kézmentes használat számos más fogyatékossággal élő ember számára is hasznos lenne. Akinek a keze nem használható, akinek a mozgása korlátozott, az ugyanúgy profitálhatna egy szemüvegbe épített asszisztensből.

Hughes érve nem elvont: a Meta Ray-Ban szemüveg egyik beépített funkciója, a beszélgetésfókusz mód például hallássérültek számára is hasznos lehetne. Scott Bécsben a Meta bemutatóján kipróbálta ezt a funkciót egy zajos teremben, és a szemüveg mikrofonjai képesek voltak kiemelni a szemben álló beszélgetőtárs hangját a háttérzajból. Nem volt érzékelhető késleltetés, és a hang nem jött vissza kétszer sem – ellentétben az Apple AirPods Live Listen funkciójával, amelynél Scott korábban azt tapasztalta, hogy a késleltetés miatt a beszélgetés természetellenes lett, mintha egy szinkronhiba nélküli filmet nézne az ember.

A probléma valószínűleg piaci logikából fakad. A vakok és gyengénlátók közössége szervezett és aktívan visszajelez – a fejlesztők itt látják a legegyértelműbb keresletet. A kamera mint érzékelő önmagában is a látássérülteknek kedvez: a kép leírása a legkézenfekvőbb felhasználási mód. De az SDK megnyitása éppen azt tenné lehetővé, hogy más közösségek igényeire is szülessenek megoldások. A podcastban is szóba került, hogy látó felhasználók is egyre többen használják a Meta szemüveget kényelmi okokból – az akadálymentesítési fejlesztések tehát szélesebb közönséghez is eljuthatnának.

A hétköznapi használat buktatói

A technológia ígéretei és a napi használat között mindig van rés. Az egyik leggyakoribb panasz a VoiceOver késleltetése a Meta szemüveggel. A probléma a Bluetooth-kapcsolatból fakad: a szemüveg hangszóróin keresztül érkező VoiceOver-visszajelzés néha érezhetően lemarad a felhasználó műveleteihez képest. Scott szerint a diktálás különösen problémás – a két ujjas dupla koppintás után néha megérkezik a hangjelzés, néha nem, és a felhasználó nem tudja, elkezdhet-e beszélni. Mindkét műsorvezető elmondta, hogy rendszeresen kikapcsolja a szemüveget, amikor az iPhone-on akar dolgozni. Az iOS audio routing beállításaival elvileg szétválasztható, hogy a VoiceOver a telefonon szóljon, míg a hívások a szemüvegen – ahogy a Bluetooth hangszóróknál is működik –, de a gyakorlatban ez nem mindig megbízható.

Az is kérdés, hogy a jelenlegi hardver meddig tartható. Az Envision szemüveg – amely az eredeti Google Glass hardverére épült – az életciklusa végéhez közeledik. A Google Glass hardvere gyakorlatilag 2017 óta nem fejlődött; az Envision sokat kihozott belőle, de a platform korlátai egyre nyilvánvalóbbak. Az Ally Solos szemüveg vegyes fogadtatásban részesült, az alternatívák tehát nem feltétlenül jobbak. Scott szerint nem lenne meglepő, ha az Envision is a Meta platformra költözne – bár erre egyelőre csak találgatás van.

A Meta Ray-Ban előnye éppen az, hogy nem akadálymentesítési eszköznek készült, hanem fogyasztói terméknek, amelyre akadálymentesítési funkciókat építenek. Ez nagyobb felhasználói bázist, folyamatos hardverfejlesztést és alacsonyabb árat jelent – de azt is, hogy a Meta üzleti döntései bármikor átírhatják a platform szabályait.

Autópálya vakoknak: a Blind Racer játék

A podcast másik nagy témája egészen más irányból közelítette meg az akadálymentesítést. Jamie Wallace brit fejlesztő a Blind Racer nevű játékát mutatta be, amelyet saját frusztrációja ihletett: Angliában nőtt fel Scalextric pályákkal, majd gyerekeivel Mario Kartot próbált játszani, de vakon nem tudott mást tenni, mint véletlenszerűen nyomkodni a gombokat.

Wallace a Scalextric elektromos autóversenyzés elvéből indult ki, ahol az autó egy résben halad, és a játékos egyetlen dolga a sebesség szabályozása. A Blind Racer ezt ülteti át mobilra: egyetlen vezérlőelem van, a képernyő érintése. Nyomva tartás egyenlő gyorsítás, elengedés egyenlő lassítás. Az információkat hang és tapintás közvetíti: a gyorsulást egyre sűrűbb pittyegések jelzik, a kanyarokat a jobb vagy bal fülhallgatóban szóló jelzések mutatják. Ha az autó kirepül a pályáról – mert a játékos túl gyorsan ment a kanyarban –, a telefon rezegni kezd, és az autó automatikusan visszakerül, de csak némi időbüntetéssel. Wallace tudatosan döntött az automatikus visszahelyezés mellett: tudta, hogy ha a játékos vakon próbálna visszatalálni a pályára, az játszhatatlanná tenné az egészet.

A koncepció egyszerűsége a lényeg. Wallace nem próbálta meg „hozzáférhetővé tenni” egy meglévő, vizuális játékot, hanem az alapoktól tervezett egy olyan versenyjátékot, ahol a vizuális információ nem szükséges. Ez fontos különbség: az utólagos akadálymentesítés szinte mindig kompromisszumokkal jár, míg az eleve akadálymentes tervezés teljes értékű élményt adhat.

A játék jelenleg nyilvános bétában érhető el, és Wallace kifejezetten azért kereste meg a Double Tap szerkesztőségét, hogy minél szélesebb körű visszajelzést kapjon a vak felhasználóktól. Wallace korábban a J-Key nevű alkalmazást fejlesztette, amely az iPhone-os gépelést könnyítette meg vakok és mozgáskorlátozottak számára.

A műsorvezetők között rövid vita is kerekedett az akadálymentes játékokról. Scott bevallottan nem játékos – a legjobb szórakozása az NVDA képernyőolvasó töltési hangjelzéseinek hallgatása, amiből megpróbálja kitalálni, hányszázaléknál tart a folyamat. Preece viszont a Night Manager nevű akadálymentes játék veteránja, és úgy véli, hogy az audiojátékok képesek valódi bevonódást adni, nem csupán hangjelzésekre való reagálást. A Blind Racer megközelítése éppen erre épít: a mechanika egyszerűsége nem korlátozás, hanem tervezési döntés – ahogy az eredeti Scalextricnél is az egyetlen szabályozó volt az egész játék lényege.

Hang és tapintás mint felhasználói felület

A podcastban bemutatott alkalmazások – az Ooriontól a Blind Racerig – közös tervezési mintát követnek: a vizuális információt hangjelzésekre és haptikus visszajelzésre fordítják le. Az Oorion térbeli hangot használ a tárgyak irányának jelzésére, és a hangjelzések sűrűsödésével közvetíti a távolságot. A Blind Racer sztereó hangot használ a kanyarok jelzésére, és rezgést az ütközések visszajelzésére. Mindkét esetben az a cél, hogy a felhasználó tanulás nélkül, ösztönösen értse a jelzéseket.

A Meta Ray-Ban ökoszisztéma fejlődése biztató, de a tét nagy. Ha a platform sikeresen vonz fejlesztőket és a minőség tartható, az okosszemüveg válhat az első igazán használható, mindennapi segédeszközzé vakok és más fogyatékossággal élők számára. Ehhez viszont arra is szükség van, hogy a fejlesztők a vakok közösségén túl is gondolkodjanak – ahogy Colin Hughes is jelezte.

A cikk a Double Tap podcast 2026. március 18-i adása alapján készült.

Szólj hozzá!

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük