Akadálymentesítés a mesterséges intelligencia korában

Az Apple nagyszabású fejlesztéseket jelent be a globális akadálymentesítési tudatosság napja előtt, a Meta okosszemüvegei hangvezérléssel bővülnek, és egy vak techrajongó Raspberry Pi-projektje megmutatja, hogyan nyitja meg az AI a Linux-alapú eszközök világát a látássérültek előtt is.

—

A technológiai ipar minden év május harmadik csütörtökén szinte kötelező jelleggel teszi közzé akadálymentesítési bejelentéseit a Global Accessibility Awareness Day alkalmából. Idén azonban a bejelentések mennyisége és tartalma messze meghaladja a szokásos évközi frissítések szintjét. A Double Tap podcast május 19-i adásában Steven Scott és Shaun Preece végigvette az Apple, a Meta és a Microsoft legfrissebb fejlesztéseit – miközben kiderült, hogy egy Raspberry Pi és egy AI-asszisztens kombinációja megnyithatja a Linux-alapú kísérletezés ajtaját a látássérült felhasználók előtt is.

Az iparág egyre határozottabban jelzi: az AI nem csupán produktivitási eszköz, hanem az akadálymentesítés egyik leghatásosabb mozgatórugója lett.

—

A VoiceOver kap egy AI-agyat

Az Apple az iOS 27-es verziójával a VoiceOver képernyőolvasóba beépíti az Apple Intelligence rendszerét. Ez három területen hoz érdemi változást.

Az első a gazdagabb képleírás. Jelenleg, ha a felhasználó alt szöveg nélküli képre kerül, a VoiceOver vagy semmit nem mond, vagy elnagyolt leírást ad. Az új verzióban részletes, természetes hangzású leírást generál. Az Apple bemutatójában egy vacsorameghívó fotójának értelmezése szerepelt: a VoiceOver nemcsak azt mondta el, hogy egy terített asztal látható két személyre fehér tányérokkal és evőeszközökkel, hanem ebből a kontextusból az üzenet értelme is azonnal nyilvánvaló lett.

A második újítás az Image Explorer, amely lehetővé teszi, hogy a felhasználó egy képen belül további kérdéseket tegyen fel, mélyebben feltárva annak tartalmát. Ez az a funkció, amelyre a képernyőolvasó-felhasználók évek óta vártak – és amelyet Android-platformon a Google Gemini már kínál.

A harmadik újítás a valósidejű felismerés (live recognition). A felhasználó megnyomja az akciógombot, ráirányítja a kamerát a környezetére, és természetes nyelven kérdezhet: hol vannak a kulcsaim? Mit ír ez a tábla? Az Apple bemutatójában a rendszer egy „üzemen kívül” feliratot olvasott le, hozzátéve a nyílra vonatkozó iránymutatást is. Ez a részlet nem véletlen: a feliratok iránya korábban az ilyen segédeszközök egyik legnagyobb hiányossága volt. Shaun Preece kiemelte, hogy kórházi tájékozódás közben a Seeing AI alkalmazás ugyan kimondta az „exit” szót, de a három irány közül melyik az igazit, azt az iránytábla nyila nélkül lehetetlen volt megállapítani.

A funkció LIDAR-t nem igényel, így bármely, Apple Intelligence-t futtató iPhone-on – azaz iPhone 15 Pro-tól felfelé – elérhető lesz. A Mac-es VoiceOver szintén megkapja ezeket a fejlesztéseket.

—

A Magnifier és az olvasási segédeszközök fejlesztései

A Magnifier ugyanolyan AI-réteget kap, mint a VoiceOver, de egy fontos különbséggel: az interfész kifejezetten gyengénlátó felhasználókra van optimalizálva – magas kontraszttal, nagy szöveggel. Az Apple bemutatójában valaki egy szakácskönyv receptje fölé tartotta a telefonját, és megkérdezte, meddig kell sütni az ételt. A rendszer a fotóból kiolvasva válaszolt: 45 percig fedővel, majd 10–15 percig anélkül, és azt is megmondta, hány adagot tesz ki a recept.

Steven Scott rámutatott, hogy ez a funkció korántsem csak vak vagy gyengénlátó felhasználóknak hasznos: olvasási nehézséggel, diszlexiával élő emberek vagy az apró nyomtatott szöveggel küszködő idősebb korosztály is profitálhat belőle.

A Magnifier Mac-en is bővül: az iPhone kameráját vagy egy csatlakoztatott webkamerát felhasználva mostantól távolabb lévő képernyőket, táblákat is be lehet zoomolni – az Apple egy fizikaterem eredménytábláját hozta példaként, ahol egy gyengénlátó tanuló nem olvashatta le az eredményét.

Az Accessibility Reader funkció szintén AI-fejlesztést kap: automatikusan eltávolítja az oldalszámokat, ismétlődő fejléceket és egyéb „zajt” a PDF-ekből, kezeli a táblázatokat és ábrákat, és kérésre összefoglalót vagy fordítást is készít – megőrizve a felhasználó preferált olvasási formátumát.

—

Az Apple Vision Pro és a kerekesszék

Ha valamelyik bejelentés külön figyelmet érdemel, ez az. Az Apple Vision Pro headsetet – amelyet sokan piaci kudarcként könyveltek el – most kerekesszék-vezérlésre is alkalmassá tesznek.

Az ALS-sel, gerincvelő-sérüléssel vagy súlyos agyi bénulással élő felhasználók egy része jelenleg szemkövető rendszerekkel vezérli a kerekesszékét. Ezek tabletes, széken rögzített eszközök, amelyek infravörös szenzorokat használnak – közvetlen napfényben nem működnek, és minden pózváltás után újra kell kalibrálni őket.

Az Apple Vision Pro szemmozgás-követő rendszere a headset belsejébe van építve, így nem érzékeny a napfényre, és nem veszíti el a kalibrációt mozgás közben. A működési elv egyszerű: irányvezérlő nyilak jelennek meg a látótérben, a felhasználó a kívánt irányra néz, és a szék elindul. A headset közben más feladatokra is viselhető – üzenetek olvasása, fotók nézegetése.

A funkció az Egyesült Államokban indul a Tolt és a LUCI nevű alternatív meghajtórendszer-gyártókkal, vezetékes és Bluetooth-kapcsolattal egyaránt. Shaun Preece és Steven Scott arra is rámutatott, hogy a Vision Pro valószínűleg az Apple AR-szemüvegek előfutára: a fejlesztések nem vesznek kárba, a technológia beépül a következő generációs eszközökbe.

A nystagmus (akaratlan szemremegés) ellen külön üzemmód is elérhető – ez Shaun Preece-t különösen érintette, aki maga is nystagmussal él, és korábban kizártnak tartotta, hogy valaha működjön nála a szemkövető technológia.

—

Meta okosszemüveg: hangvezérlés és Be My Eyes integráció

A Meta bejelentése szerint a Ray-Ban Meta okosszemüvegeken hamarosan teljes egészében hangvezérléssel lehet kezelni a hívásokat a WhatsApp, Messenger, Instagram és a Be My Eyes platformokon. Eddig az okosszemüveg fogadhatta a hívásokat kézérintés nélkül, de a hívás befejezéséhez meg kellett érinteni a szemüveg oldalát vagy elővenni a telefont.

Ez komolyabb probléma, mint amilyennek hangzik: korlátozott kézmozgással élő felhasználóknál a „kézszabad” hívásélmény csapdává vált – a hívás beindult anélkül, hogy a felhasználó hozzányúlt volna bármihez, befejezni viszont már nem tudta. Az új hangparancsok – „Hei Meta, bontsd a hívást”, „Hei Meta, kapcsold ki a videót” – ezt a hiányosságot orvosolják.

A Be My Eyes csoportos hívásai és a szolgáltatói könyvtár is megjelenik hamarosan, valós idejű feliratozás érkezik az új kijelzős Ray-Ban szemüvegekre, és egygombos gyorsparancsok is elérhetők lesznek bizonyos modelleken. A műsorvezetők ugyanakkor fenntartásaiknak is hangot adtak: a „fokozatos bevezetés” időpontjai és az elérhetőség régiónként változó.

—

Hangvezérlés és generált feliratok

A hangvezérlés (Voice Control) – amely azoknak szól, akik látják a képernyőt, de nem tudják érinteni – szintén Apple Intelligence-integrációt kap. Eddig pontos elemcímkéket kellett ismerni: ha a parancs nem egyezett szó szerint azzal, amit a rendszer tárol, nem történt semmi. Az új verzióban természetes leírások is elfogadottak: „nyomd meg a narancssárga mappát”, „kattints a tengerparti fotóra”. Shaun Preece megjegyezte, hogy a hangvezérlést folyamatosan bekapcsolva tartja a képernyőolvasó mellett, és a pontosabb névfelismerés számára is komoly könnyítést jelent – nem kell fejből tudni, mi egy adott gomb pontos rendszercímkéje, elég körülírni.

Az automatikusan generált feliratok szintén megjelennek: az iPhone, iPad, Mac, Apple TV és Apple Vision Pro mostantól bármilyen videóhoz valós idejű feliratot generál, kizárólag eszközön belül, felhőbe küldés nélkül. Induláskor angol nyelven érhető el; más nyelvekre egyelőre az élő feliratok (Live Captions) funkció marad érvényben.

—

Kisebb frissítések, amelyek sokat számítanak

Az Apple számos további, kisebb frissítést is bejelentett. A tvOS végre megkapja a nagyobb szövegtámogatást – ez régóta hiányzott, hiszen eddig a TV-n csak egy korlátozott tartományú nagyítás volt elérhető, az egész képernyő átméretezése nem. Az érintő-alkalmazkodók (Touch Accommodations) beállítási folyamata megújul: kifejezetten mozgáskorlátozott felhasználókra szabott, személyre szabható beállítási folyamatot kapnak, hogy az eszköz kezdeti konfigurációja kevésbé legyen akadályos. A Made for iPhone hallókészülékek átkapcsolása Mac és iPhone között is zökkenőmentesebbé válik. A Névfelismerés (Name Recognition) – amely értesítést küld, ha valaki kiszólítja a felhasználót – tavaly indult el néhány nyelven; mostantól több mint 50 nyelvre bővül.

Érdemes külön megemlíteni Bailey Hikawa designertől a MagSafe-fogantyút, amelyet mostantól az Apple Store forgalmaz. A termék fogyatékkal élő felhasználókkal közösen született: mélyen barázdált hátlappal és ujjaknak való kapaszkodóval rendelkezik, egyszerre nyújt jobb tartást és asztali állványt. A gyártást a PopSockets vállalta át, így a korábban korlátozott szériából globálisan elérhető termék lett. Ahogy az egyik vak tesztelő a videóban megfogalmazta: az eszköz „nem szégyelli önmagát” – és ez a megközelítés az inkluzív design egyik legjobb példája.

—

A Microsoft Ability Summit

A Double Tap adásával egy időben nyílt meg a Microsoft éves kétnapos akadálymentesítési csúcstalálkozója, az Ability Summit, a redmondi Microsoft-kampusz konferenciaközpontjában. A digitális keynote globálisan elérhető streamként futott – Csendes-óceáni idő szerint reggel 9-kor, brit idő szerint délután 5-kor. A műsorvezetők ígéretet tettek, hogy a következő adásban részletesen ismertetik a legfontosabb bejelentéseket.

—

Raspberry Pi és az AI mint akadálymentesítési híd

A podcast egyik legérdekesebb szegmense Steven Scott Raspberry Pi-projektje volt. A Raspberry Pi egy miniatűr, alacsony fogyasztású számítógép – jellemzően kis áramköri lapként vásárolható meg, amelyre USB-s perifériák csatlakoztathatók, és Linux operációs rendszer fut rajta. A látássérültek körében kevéssé ismert eszköz, részben azért, mert a Linux-környezet Orca nevű képernyőolvasója és a különböző disztribúciók kevés akadálymentesítési dokumentációval rendelkeznek.

Steven Scott azt mutatta meg, hogyan hidalta át ezt a problémát: csatlakoztatta az eszközt a hálózathoz, majd a Claude AI-asszisztenst (az Anthropic cég termékét) kérte meg, hogy keresse meg és konfigurálja a Raspberry Pi-t. A Claude telepítette az Orca képernyőolvasót, majd – Steven ízlésére hivatkozva – a Piper TTS hangokat is letöltötte és sorban lejátszotta, hogy a felhasználó választhasson. Mindezt anélkül, hogy Steven a Raspberry Pi-hoz nyúlt volna.

Steven tervei szerint a billentyűzetként is funkcionáló Raspberry Pi-t otthona különböző pontjairól fogja a hálózatán lévő számítógépekhez csatlakoztatni – egyfajta kompakt, hordozható terminálként. Ez a példa azt illusztrálja, hogy az AI-asszisztensek nemcsak produktivitási eszközként, hanem akadálymentesítési kapuőrként is működhetnek: olyan eszközök elérhetővé tételét teszik lehetővé, amelyek korábban kizárólag mélyebb technikai tudással rendelkezők számára voltak hozzáférhetők.

—

Összegzés

Az idei bejelentések összképe nem az inkrementális fejlesztések szokásos rendjét mutatja, hanem egy iparágét, amelyben az AI alapvetően átírja az akadálymentesítés lehetőségeit. Az Apple a meglévő platformjain belül terjeszt szét olyan képességeket, amelyek korábban külön alkalmazásokban, külön előfizetésekkel léteztek; a Meta a szemüveg-platformot valódi önálló segédeszközzé fejleszti; és a közösség – mint Bailey Hikawa MagSafe-fogantyújának esete mutatja – maga is aktív résztvevője lett ennek a folyamatnak. A technológia egyre kevésbé igényli, hogy a felhasználó alkalmazkodjon hozzá: ehelyett az eszközök tanulnak meg alkalmazkodni.

—

A cikk a Double Tap podcast 2026. május 19-i adása alapján, AI felhasználásával készült, ezért apróbb pontatlanságokat tartalmazhat.