Mesterséges intelligencia vak szemmel: ígéretek és valóság között

Az American Foundation for the Blind (Vakok Amerikai Alapítványa) közel ezernyolcszáz résztvevős kutatása alapján az AI komoly lehetőségeket kínál a látássérült felhasználók számára – a gyakorlat azonban még messze elmarad az elvárástól.

—

Széleskörű felmérés, konkrét számok

Az AFB 2025 júliusa és októbere között vizsgálta, hogyan használják a mesterséges intelligenciát a látássérült emberek. Az 1735 résztvevő közül 368 volt vak vagy gyengénlátó személy, a kontrollcsoportot 665 fogyatékossággal nem élő felnőtt alkotta. A felmérés eredményeit Dr. Arielle Silverman, az AFB kutatási igazgatója ismertette az Access On podcast 75. epizódjában.

A kutatást szándékosan tesztelték több fogyatékossági típusnál, nem csak a vak közösségen belül: a kitöltők választhattak, hogy online, telefonon, videóhívás útján vagy akár amerikai jelnyelven vesznek részt. A szándék az volt, hogy a kapott minták ne csupán a vakságra legyenek jellemzőek, hanem a fogyatékossággal élők körén belüli különbségekre is rávilágítsanak.

Figyelemre méltó, hogy a kitöltők között egyetlen olyan személy sem akadt, aki ne használna valamilyen AI-eszközt. A felmérés tartalmazott erre vonatkozó opciót, de senki nem jelölte be. Az AI tehát – akár tudatosan, akár nem – mindenki életének részévé vált.

—

Hangvezérlés, képfelismerés, mindennapos alkalmazás

A látássérült résztvevők szinte kivétel nélkül használnak hangvezérelt asszisztenst – Sirit, Alexát vagy hasonlót. Ebben nem különböznek látó kortársaiktól, a különbség azonban a használat mélységében és változatosságában rejlik. Ahol a látó felhasználó időjárást kérdez vagy zenét indít, a vak felhasználó képleírást kér, dokumentumot olvastat fel, navigációs segítséget vesz igénybe, vagy éppen AI segítségével tölt ki nyomtatványt.

A látó felhasználók körében a hangvezérelt asszisztenseket általában az egyszerűbb funkciókra – időjárás, időzítők, zeneindítás – korlátozzák. A vakoknak ez részben elérhetőségi kényszer: az érintőképernyős felületek nem mindig kényelmes alternatívák. Ugyanakkor ez azt is jelenti, hogy a vak közösség jobban megismeri e rendszerek korlátait, és hatékonyabb visszajelzést tud adni a fejlesztőknek.

A résztvevők közel nyolcvan százaléka él képleírási eszközökkel. Ez az arány jól mutatja, hogy az AI egyfajta hidaló technológiává vált: az interneten tömegesen előforduló, képernyőolvasóval (a képernyő tartalmát felolvasó szoftverrel) nem hozzáférhető tartalmak és a látássérültek eszközei közé ékelődve áthidalja azt a szakadékot, amelyet a vizuális kultúra dominanciája nyit.

—

Ami még nem működik jól

A kutatás korlátokat is dokumentált. A résztvevők komoly aggályokat fogalmaztak meg az AI jelenlegi hiányosságaival kapcsolatban. A hallucinációk – amikor a rendszer magabiztosan állít valótlant – különösen veszélyes problémát jelentenek olyan felhasználók számára, akik a szöveges információhoz más úton nehezebben jutnak hozzá. Ha egy látó személy téves adatot kap, könnyen leellenőrzi más forrásban; egy vak felhasználó esetében a téves képleírást jóval nehezebb felismerni.

A kutatásban résztvevők konkrét eseteket is megosztottak. Az egyik legszembetűnőbb probléma: az AI olykor nem ott hibázik, ahol várható lenne, hanem éppen a látszólag biztos esetekben téved. Egy résztvevő gyógyszercsomagolást fotózott, és a leírás tablettás adagolást javasolt – holott egy kenőcs tubusáról volt szó. Egy másik esetben az AI „galléros inget” látott egy egyszerű feliratú pólón, ami kellemetlen meglepetést okozott egy szakmai rendezvényen. Ezek a hibák nem véletlen félreértések: az AI az adatbázisából ismerős mintát vetít rá az adott képre ahelyett, hogy azt ténylegesen azonosítaná.

Ebből következik az ellenőrzés dilemmája: ha a vak felhasználónak mindig szüksége van egy emberi megerősítőre a leírás ellenőrzéséhez, akkor az AI valóban nyereséges megoldás-e? A válasz kontextusfüggő. Egy hotelszobai ablakból készített fotónál, ahol a leírás tájékoztatást nyújt a környezetről, kisebb a tét, mint egy gyógyszercímkénél.

Az adatvédelem szintén hangsúlyos témának bizonyult. Érzékeny adatok – egészségügyi, pénzügyi vagy személyes információk – esetén a látássérült résztvevők inkább emberi olvasót részesítik előnyben az AI-rendszerrel szemben. A magyarázat kézenfekvő: az AI-alapú megoldások nagy része felhőbe küldi a feldolgozandó tartalmat, és sokan nem bíznak abban, hogy ezek az adatok valóban bizalmasan kezeltetnek.

Ugyanakkor az is kiderült: ha az adatfeldolgozás teljes egészében az eszközön belül zajlik, és semmi nem kerül ki külső szerverekre, a látássérültek szívesebben bízzák az AI-ra az érzékeny anyagokat is. Ez erős piaci jelzés az úgynevezett on-device, vagyis eszközön futó AI-megoldások irányába. A Perspective Intelligence nevű termék például pontosan erre az igényre épít: Apple-eszközökre fejlesztett, on-device megoldást kínál, ahol minden feldolgozás helyben történik, külső adatátvitel nélkül.

—

Terápia, foglalkoztatás, önvezető autók

A kutatás több olyan területet is vizsgált, ahol az AI látássérülteket érintő hatásai összetett képet mutatnak.

Mentális egészség. Az AI-alapú pszichoterápiás alkalmazásokat a látássérült résztvevők részben vonzónak találják: elérhetők akkor is, amikor emberi szakember nincs kéznél, megfizethetőbbek a hagyományos terápiánál, és nem kell azonnal felfedni a fogyatékosságot – elkerülhető a stigmatizáció első akadálya. Az aggályok azonban komolyak. A felmérés rámutatott, hogy egyes chatbotok önkárosító gondolatokat erősítő válaszokat adhatnak, vagy ableista sztereotípiákat tükröznek. Az egyik dokumentált esetben egy chatbot a „halálpozitivitási mozgalom” irodalmát ajánlotta egy fogyatékos személynek, aki nehézségeiről számolt be – etikailag nyilvánvalóan aggályos reakció.

Foglalkoztatás és oktatás. Az automatizált álláspályázati folyamatok – ahol AI szűri az önéletrajzokat, vagy videóinterjúk során az algoritmus értékeli a jelölt szemkontaktusát és arckifejezéseit – strukturálisan hátrányos helyzetbe hozhatják a látássérült pályázókat. Egy vak ember, aki nem tart szemkontaktust a kamerával, vagy akinek arcmimikája eltérő mintázatot követ, alulteljesíthet egy olyan rendszerben, amelyet tipikusan látó felhasználókra kalibráltak. A 2024-es AFB-tanulmány legfontosabb megállapítása éppen ezért szögezte le: ahol AI-t alkalmaznak jelöltek szűrésére, emberi felülvizsgálatnak is kell lennie.

Az oktatás területén más ellentmondás rajzolódik ki. Hallgatók egyre inkább AI-eszközökhöz fordulnak, ha az egyetem nem biztosít hozzáférhető tananyagot – a kutatás szerint részben azért, mert AI-nak könnyebb felfedni a fogyatékosságot, mint egy professzornak vagy egy intézményi irodának. Ez segít, de aggályt is vet fel: ha az egyetemek rájönnek, hogy a hallgatók AI segítségével boldogulnak az inaccessible anyagokkal, csökkenhet a nyomás a valódi akadálymentesítésre. Az ellenkező veszély szintén fennáll: ha az intézmények az AI-használatot a csalással azonosítják és tiltják, az a fogyatékos hallgatókat aránytalanul érintheti.

Önvezető járművek. A látássérült résztvevők körében az autonóm járművek iránt szinte egységes lelkesedés mutatkozik – nem meglepő módon: egy sofőrt nem igénylő eszköz önállóságot adhat vissza azoknak, akik ma tömegközlekedésre vagy mások segítségére szorulnak. A valóság azonban vegyes. A Waymo-val utazó látássérült utasok közül csupán körülbelül ötven százalék nyilatkozott úgy, hogy a szolgáltatás teljesen akadálymentesen elérhető; a látó utasoknál ez az arány hetvenöt százalék volt. A leggyakoribb probléma nem maga az utazás, hanem a célállomás megtalálása kiszállás után: az önvezető autó leteszi az utast, de ha az utas vak és az épület bejárata nincs jelölve, az utolsó néhány méter komoly kihívást jelent. A Waymo kiosk – az érintőképernyős terminál – szintén nem akadálymentes; az alkalmazás igen, a fizikai eszköz nem. Pozitívum ugyanakkor, hogy az önvezető rendszer nem diszkriminál a segítő kutya kísérőivel szemben – ellentétben az Uber és a Lyft sofőrjeivel, ahol az ilyen incidensek nem ritkák.

A demográfiai adatok is tanulságosak: a hatvanöt év feletti résztvevők lelkesebben fogadják az autonóm járműveket, mint a fiatalabbak – ami azzal magyarázható, hogy idősebb korban a mobilitás elvesztése különösen fenyegető perspektíva. A nem fehér résztvevők az AI-val kapcsolatos kérdések szélesebb körében is pozitívabban nyilatkoztak, mint fehér társaik.

—

Olvasói kérdések a műsorban

Az epizód második részében Jonathan Mosen néhány hallgatói levélre válaszolt.

Jessica Dale az ooTunes iOS-alkalmazásból szerette volna exportálni saját felvételeit, de a fejlesztő, Steven útmutatója VoiceOver (az iPhone beépített képernyőolvasója) mellett nem működött. Mosen javaslata: kapcsolja ki ideiglenesen a VoiceOvert, és próbálja meg az ujjmozdulatot anélkül – egyes alkalmazásokban az akadálymentességi mód módosítja az érintési területek viselkedését.

Szóba kerültek az Egyesült Királyságon kívülről hallgatható BBC-csatornák is: a Triode nevű alkalmazás erre alkalmas, évi tíz dolláros előfizetéssel lehetővé teszi a kedvencek mentését. Fejlesztője a The Iconfactory, a Twitterrific alkotói.

Steve Cutway Kanadából az Echo Pop nevű Amazon-eszközről számolt be, megjegyezve, hogy az Alexa Plus szolgáltatás Kanadában 2025 novemberétől válik elérhetővé. Cy New Yorkból a Substack hírlevél-platform akadálymentességét kérdezte; a műsorvezető elmondta, hogy az NFB (National Federation of the Blind) Kiválóság Központja egyelőre nem vette fel a kapcsolatot a Substackkel, de nyitottak erre.

—

Egy kis trükk a diktáláshoz

Az epizód egy gyakorlati tippel zárult, amelyet Joe Good (Arizona, NFB) osztott meg. Az iOS beépített diktálási funkciója – és a Siri – olykor nehezen boldogul speciális szavakkal, nevekkel vagy rövidítésekkel. A megoldás egyszerű: a problémás szót (például a JAWS – Job Access With Speech, népszerű képernyőolvasó szoftver, a Freedom Scientific fejlesztése – nevét) adjuk hozzá az iPhone névjegyei közé keresztnévként. A rendszer tanul a névjegyekből, így a következő diktálásnál már helyesen ismeri fel a szót. A könnyebb rendszerezés kedvéért a „dictionary” (szótár) szó beírható a vezetéknév mezőbe, hogy az ilyen bejegyzések elkülöníthetők legyenek a valódi névjegyektől.

—

Összegzés

Az AFB kutatása nem fest sem rózsás, sem drámai képet: az AI valóban hasznos eszközzé vált a látássérült felhasználók számára, és egyes területeken – képleírás, dokumentumhozzáférés, navigáció – érdemi minőségjavulást hozott. A hallucinációk, az adatvédelmi kockázatok, az automatizált felvételi rendszerek kizáró hatása és az akadálymentességi hiányosságok ugyanakkor azt jelzik, hogy a technológia fejlesztői még mindig nem kezelik prioritásként a látássérült felhasználók igényeit. Az eszközön futó AI iránti érdeklődés, az önvezető járművektől várt önállóság és a foglalkoztatási aggályok mind ugyanarra mutatnak: a lehetőség adott, a megvalósítás sok helyen azonban még elmarad.

—

A cikk az Access On podcast 75. epizódja alapján, AI felhasználásával készült, ezért apróbb pontatlanságokat tartalmazhat.