Akadálymentesítés a mesterséges intelligencia korában

Az Apple nagyszabású fejlesztéseket jelent be a globális akadálymentesítési tudatosság napja előtt, a Meta okosszemüvegei hangvezérléssel bővülnek, és egy vak techrajongó Raspberry Pi-projektje megmutatja, hogyan nyitja meg az AI a Linux-alapú eszközök világát a látássérültek előtt is.

A technológiai ipar minden év május harmadik csütörtökén szinte kötelező jelleggel teszi közzé akadálymentesítési bejelentéseit a Global Accessibility Awareness Day alkalmából. Idén azonban a bejelentések mennyisége és tartalma messze meghaladja a szokásos évközi frissítések szintjét. A Double Tap podcast május 19-i adásában Steven Scott és Shaun Preece végigvette az Apple, a Meta és a Microsoft legfrissebb fejlesztéseit – miközben kiderült, hogy egy Raspberry Pi és egy AI-asszisztens kombinációja megnyithatja a Linux-alapú kísérletezés ajtaját a látássérült felhasználók előtt is.

Az iparág egyre határozottabban jelzi: az AI nem csupán produktivitási eszköz, hanem az akadálymentesítés egyik leghatásosabb mozgatórugója lett.

A VoiceOver kap egy AI-agyat

Az Apple az iOS 27-es verziójával a VoiceOver képernyőolvasóba beépíti az Apple Intelligence rendszerét. Ez három területen hoz érdemi változást.

Az első a gazdagabb képleírás. Jelenleg, ha a felhasználó alt szöveg nélküli képre kerül, a VoiceOver vagy semmit nem mond, vagy elnagyolt leírást ad. Az új verzióban részletes, természetes hangzású leírást generál. Az Apple bemutatójában egy vacsorameghívó fotójának értelmezése szerepelt: a VoiceOver nemcsak azt mondta el, hogy egy terített asztal látható két személyre fehér tányérokkal és evőeszközökkel, hanem ebből a kontextusból az üzenet értelme is azonnal nyilvánvaló lett.

A második újítás az Image Explorer, amely lehetővé teszi, hogy a felhasználó egy képen belül további kérdéseket tegyen fel, mélyebben feltárva annak tartalmát. Ez az a funkció, amelyre a képernyőolvasó-felhasználók évek óta vártak – és amelyet Android-platformon a Google Gemini már kínál.

A harmadik újítás a valósidejű felismerés (live recognition). A felhasználó megnyomja az akciógombot, ráirányítja a kamerát a környezetére, és természetes nyelven kérdezhet: hol vannak a kulcsaim? Mit ír ez a tábla? Az Apple bemutatójában a rendszer egy „üzemen kívül” feliratot olvasott le, hozzátéve a nyílra vonatkozó iránymutatást is. Ez a részlet nem véletlen: a feliratok iránya korábban az ilyen segédeszközök egyik legnagyobb hiányossága volt. Shaun Preece kiemelte, hogy kórházi tájékozódás közben a Seeing AI alkalmazás ugyan kimondta az „exit” szót, de a három irány közül melyik az igazit, azt az iránytábla nyila nélkül lehetetlen volt megállapítani.

A funkció LIDAR-t nem igényel, így bármely, Apple Intelligence-t futtató iPhone-on – azaz iPhone 15 Pro-tól felfelé – elérhető lesz. A Mac-es VoiceOver szintén megkapja ezeket a fejlesztéseket.

A Magnifier és az olvasási segédeszközök fejlesztései

A Magnifier ugyanolyan AI-réteget kap, mint a VoiceOver, de egy fontos különbséggel: az interfész kifejezetten gyengénlátó felhasználókra van optimalizálva – magas kontraszttal, nagy szöveggel. Az Apple bemutatójában valaki egy szakácskönyv receptje fölé tartotta a telefonját, és megkérdezte, meddig kell sütni az ételt. A rendszer a fotóból kiolvasva válaszolt: 45 percig fedővel, majd 10–15 percig anélkül, és azt is megmondta, hány adagot tesz ki a recept.

Steven Scott rámutatott, hogy ez a funkció korántsem csak vak vagy gyengénlátó felhasználóknak hasznos: olvasási nehézséggel, diszlexiával élő emberek vagy az apró nyomtatott szöveggel küszködő idősebb korosztály is profitálhat belőle.

A Magnifier Mac-en is bővül: az iPhone kameráját vagy egy csatlakoztatott webkamerát felhasználva mostantól távolabb lévő képernyőket, táblákat is be lehet zoomolni – az Apple egy fizikaterem eredménytábláját hozta példaként, ahol egy gyengénlátó tanuló nem olvashatta le az eredményét.

Az Accessibility Reader funkció szintén AI-fejlesztést kap: automatikusan eltávolítja az oldalszámokat, ismétlődő fejléceket és egyéb „zajt” a PDF-ekből, kezeli a táblázatokat és ábrákat, és kérésre összefoglalót vagy fordítást is készít – megőrizve a felhasználó preferált olvasási formátumát.

Az Apple Vision Pro és a kerekesszék

Ha valamelyik bejelentés külön figyelmet érdemel, ez az. Az Apple Vision Pro headsetet – amelyet sokan piaci kudarcként könyveltek el – most kerekesszék-vezérlésre is alkalmassá tesznek.

Az ALS-sel, gerincvelő-sérüléssel vagy súlyos agyi bénulással élő felhasználók egy része jelenleg szemkövető rendszerekkel vezérli a kerekesszékét. Ezek tabletes, széken rögzített eszközök, amelyek infravörös szenzorokat használnak – közvetlen napfényben nem működnek, és minden pózváltás után újra kell kalibrálni őket.

Az Apple Vision Pro szemmozgás-követő rendszere a headset belsejébe van építve, így nem érzékeny a napfényre, és nem veszíti el a kalibrációt mozgás közben. A működési elv egyszerű: irányvezérlő nyilak jelennek meg a látótérben, a felhasználó a kívánt irányra néz, és a szék elindul. A headset közben más feladatokra is viselhető – üzenetek olvasása, fotók nézegetése.

A funkció az Egyesült Államokban indul a Tolt és a LUCI nevű alternatív meghajtórendszer-gyártókkal, vezetékes és Bluetooth-kapcsolattal egyaránt. Shaun Preece és Steven Scott arra is rámutatott, hogy a Vision Pro valószínűleg az Apple AR-szemüvegek előfutára: a fejlesztések nem vesznek kárba, a technológia beépül a következő generációs eszközökbe.

A nystagmus (akaratlan szemremegés) ellen külön üzemmód is elérhető – ez Shaun Preece-t különösen érintette, aki maga is nystagmussal él, és korábban kizártnak tartotta, hogy valaha működjön nála a szemkövető technológia.

Meta okosszemüveg: hangvezérlés és Be My Eyes integráció

A Meta bejelentése szerint a Ray-Ban Meta okosszemüvegeken hamarosan teljes egészében hangvezérléssel lehet kezelni a hívásokat a WhatsApp, Messenger, Instagram és a Be My Eyes platformokon. Eddig az okosszemüveg fogadhatta a hívásokat kézérintés nélkül, de a hívás befejezéséhez meg kellett érinteni a szemüveg oldalát vagy elővenni a telefont.

Ez komolyabb probléma, mint amilyennek hangzik: korlátozott kézmozgással élő felhasználóknál a „kézszabad” hívásélmény csapdává vált – a hívás beindult anélkül, hogy a felhasználó hozzányúlt volna bármihez, befejezni viszont már nem tudta. Az új hangparancsok – „Hei Meta, bontsd a hívást”, „Hei Meta, kapcsold ki a videót” – ezt a hiányosságot orvosolják.

A Be My Eyes csoportos hívásai és a szolgáltatói könyvtár is megjelenik hamarosan, valós idejű feliratozás érkezik az új kijelzős Ray-Ban szemüvegekre, és egygombos gyorsparancsok is elérhetők lesznek bizonyos modelleken. A műsorvezetők ugyanakkor fenntartásaiknak is hangot adtak: a „fokozatos bevezetés” időpontjai és az elérhetőség régiónként változó.

Hangvezérlés és generált feliratok

A hangvezérlés (Voice Control) – amely azoknak szól, akik látják a képernyőt, de nem tudják érinteni – szintén Apple Intelligence-integrációt kap. Eddig pontos elemcímkéket kellett ismerni: ha a parancs nem egyezett szó szerint azzal, amit a rendszer tárol, nem történt semmi. Az új verzióban természetes leírások is elfogadottak: „nyomd meg a narancssárga mappát”, „kattints a tengerparti fotóra”. Shaun Preece megjegyezte, hogy a hangvezérlést folyamatosan bekapcsolva tartja a képernyőolvasó mellett, és a pontosabb névfelismerés számára is komoly könnyítést jelent – nem kell fejből tudni, mi egy adott gomb pontos rendszercímkéje, elég körülírni.

Az automatikusan generált feliratok szintén megjelennek: az iPhone, iPad, Mac, Apple TV és Apple Vision Pro mostantól bármilyen videóhoz valós idejű feliratot generál, kizárólag eszközön belül, felhőbe küldés nélkül. Induláskor angol nyelven érhető el; más nyelvekre egyelőre az élő feliratok (Live Captions) funkció marad érvényben.

Kisebb frissítések, amelyek sokat számítanak

Az Apple számos további, kisebb frissítést is bejelentett. A tvOS végre megkapja a nagyobb szövegtámogatást – ez régóta hiányzott, hiszen eddig a TV-n csak egy korlátozott tartományú nagyítás volt elérhető, az egész képernyő átméretezése nem. Az érintő-alkalmazkodók (Touch Accommodations) beállítási folyamata megújul: kifejezetten mozgáskorlátozott felhasználókra szabott, személyre szabható beállítási folyamatot kapnak, hogy az eszköz kezdeti konfigurációja kevésbé legyen akadályos. A Made for iPhone hallókészülékek átkapcsolása Mac és iPhone között is zökkenőmentesebbé válik. A Névfelismerés (Name Recognition) – amely értesítést küld, ha valaki kiszólítja a felhasználót – tavaly indult el néhány nyelven; mostantól több mint 50 nyelvre bővül.

Érdemes külön megemlíteni Bailey Hikawa designertől a MagSafe-fogantyút, amelyet mostantól az Apple Store forgalmaz. A termék fogyatékkal élő felhasználókkal közösen született: mélyen barázdált hátlappal és ujjaknak való kapaszkodóval rendelkezik, egyszerre nyújt jobb tartást és asztali állványt. A gyártást a PopSockets vállalta át, így a korábban korlátozott szériából globálisan elérhető termék lett. Ahogy az egyik vak tesztelő a videóban megfogalmazta: az eszköz „nem szégyelli önmagát” – és ez a megközelítés az inkluzív design egyik legjobb példája.

A Microsoft Ability Summit

A Double Tap adásával egy időben nyílt meg a Microsoft éves kétnapos akadálymentesítési csúcstalálkozója, az Ability Summit, a redmondi Microsoft-kampusz konferenciaközpontjában. A digitális keynote globálisan elérhető streamként futott – Csendes-óceáni idő szerint reggel 9-kor, brit idő szerint délután 5-kor. A műsorvezetők ígéretet tettek, hogy a következő adásban részletesen ismertetik a legfontosabb bejelentéseket.

Raspberry Pi és az AI mint akadálymentesítési híd

A podcast egyik legérdekesebb szegmense Steven Scott Raspberry Pi-projektje volt. A Raspberry Pi egy miniatűr, alacsony fogyasztású számítógép – jellemzően kis áramköri lapként vásárolható meg, amelyre USB-s perifériák csatlakoztathatók, és Linux operációs rendszer fut rajta. A látássérültek körében kevéssé ismert eszköz, részben azért, mert a Linux-környezet Orca nevű képernyőolvasója és a különböző disztribúciók kevés akadálymentesítési dokumentációval rendelkeznek.

Steven Scott azt mutatta meg, hogyan hidalta át ezt a problémát: csatlakoztatta az eszközt a hálózathoz, majd a Claude AI-asszisztenst (az Anthropic cég termékét) kérte meg, hogy keresse meg és konfigurálja a Raspberry Pi-t. A Claude telepítette az Orca képernyőolvasót, majd – Steven ízlésére hivatkozva – a Piper TTS hangokat is letöltötte és sorban lejátszotta, hogy a felhasználó választhasson. Mindezt anélkül, hogy Steven a Raspberry Pi-hoz nyúlt volna.

Steven tervei szerint a billentyűzetként is funkcionáló Raspberry Pi-t otthona különböző pontjairól fogja a hálózatán lévő számítógépekhez csatlakoztatni – egyfajta kompakt, hordozható terminálként. Ez a példa azt illusztrálja, hogy az AI-asszisztensek nemcsak produktivitási eszközként, hanem akadálymentesítési kapuőrként is működhetnek: olyan eszközök elérhetővé tételét teszik lehetővé, amelyek korábban kizárólag mélyebb technikai tudással rendelkezők számára voltak hozzáférhetők.

Összegzés

Az idei bejelentések összképe nem az inkrementális fejlesztések szokásos rendjét mutatja, hanem egy iparágét, amelyben az AI alapvetően átírja az akadálymentesítés lehetőségeit. Az Apple a meglévő platformjain belül terjeszt szét olyan képességeket, amelyek korábban külön alkalmazásokban, külön előfizetésekkel léteztek; a Meta a szemüveg-platformot valódi önálló segédeszközzé fejleszti; és a közösség – mint Bailey Hikawa MagSafe-fogantyújának esete mutatja – maga is aktív résztvevője lett ennek a folyamatnak. A technológia egyre kevésbé igényli, hogy a felhasználó alkalmazkodjon hozzá: ehelyett az eszközök tanulnak meg alkalmazkodni.

A cikk a Double Tap podcast 2026. május 19-i adása alapján, AI felhasználásával készült, ezért apróbb pontatlanságokat tartalmazhat.

Szólj hozzá!

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük