Ha a fejlesztők nem csinálják meg, megcsináljuk magunk

A vakok közössége régen is tudta, hogy az akadálymentesítés nem kegyelem, hanem alapjog. Most először van olyan eszköz a kezükben, amivel maguk is kikényszeríthetik.

—

Egy vírusos AI-dal Puerto Ricóról, egy gimbalon forgó kamera, amelynek vezérlőszoftvere hozzáférhetetlen, és egy billentyűzetbeállító alkalmazás, amelyet egy vak fejlesztő épít fel nulláról – a Double Tap legfrissebb adása ezeken a szálakon fut végig. Shaun Preece és Steven Scott látszólag véletlenszerű témákat vesz elő, de az összefüggés hamar megmutatkozik: az AI-eszközök hozzáférhetősége, az alkotás demokratizálása és a vak közösség önrendelkezése mind ugyanabba az irányba mutat.

—

Az AI-dal, amit mindenki fütyülget

A TikTok-os és Facebook-os videofolyamban terjed egy dal. Nyolcvanas éveket idéző szintihang, fogós refrén, Puerto Ricóról szól – és teljesen mesterséges intelligencia hozta létre. Shaun Preece először azt hitte, valami elfeledett nyári slágerre akadt. Csak amikor a szöveg elkezdte a zászló motívumait sorolni, kattant be: ez AI-alkotás.

Steven Scott erre azonnal lelkesedéssel reagált. Shaun viszont fenntartásait hangoztatja: a dallam és a hangzás meggyőző, a szöveg azonban üres. Erős az indítás, aztán szétesik. Ez az ellentét – technikailag lenyűgöző, tartalmilag sekélyes – egyszerre igaz az AI-zenére és sok más AI-generált tartalomra is.

A vita azonban nem áll meg itt. Steven felveti: ha valaki az AI-zenét elveti azzal, hogy nem igazi alkotás, mert nem ember írta, akkor ugyanezt kellene mondania a vibe codingra is. Az a fejlesztő, aki AI-val ír le ezer sor kódot, attól még fejlesztőnek nevezheti-e magát? Az a zenész, aki egy AI-eszközben ad meg hangnemet, tempót, érzést, attól még zenésznek számít-e?

Az analógia nem légből kapott. A Fast Food Rockers nevű együttes a kétezres évek elején kiadott egy dalt, amelynek szövege végigzongorázta a brit gyorséttermek kínálatát – emberi kézzel. Az a dal bekerült a slágerlistákra. Ha az emberi alkotást nem minőség, hanem eredet alapján ítéljük meg, akkor valami alapvetően téves a mércénkben.

—

Az ElevenLabs-pillanat már megtörtént

Shaun Preece felidéz egy tanulságos párhuzamot. Amikor az ElevenLabs (hangszintézis-platform, amely mesterséges hangokat állít elő) megjelent, a hangalámondással foglalkozó szakemberek körében komoly aggodalom terjedt el. Az övék nem volt a legdrámaibb eset, a piac nem tűnt el egyik napról a másikra – de a korábbi érvek, miszerint az AI-hang nem elég természetes, nem elég érzelmes, nem elég rugalmas, fokozatosan elolvadtak. A cégek nem azért váltottak, mert az AI jobb lett, hanem mert olcsóbb volt. A kis vállalkozásoknak, amelyek korábban nem engedhették meg maguknak a stúdiós hangfelvételt, hirtelen ott volt egy elfogadható alternatíva töredék áron.

A Saxboy-féle Puerto Rico-dal ugyanilyen fordulópont lehet a zenében. Nem azért válik virálissá, mert jobb, mint amit emberek írnak. Hanem mert jó elég, könnyen terjed, és a hallgató – hacsak nem elemzi – nem tudja megkülönböztetni. Ha valaki a dal hatására útnak indul Puerto Ricóra, a dal elvégezte a dolgát, függetlenül attól, hogy ember vagy algoritmus hozta létre.

Ez a Suno (dalszerzést segítő AI-alkalmazás, amely szöveges leírásból képes teljes számot generálni) és hasonló eszközök mögötti logika is. Shaun próbálkozott ezekkel korábban, de a hozzáférhetőség komoly akadályt jelentett – egy AI-zeneszerzési platform, amely maga sem akadálymentesített, meglehetősen ironikus helyzet.

—

Vibe coding: amit a fejlesztők nem hajlandók megcsinálni

Az adás legsúlyosabb témája nem az AI-zene, hanem az, amit a vibe coding jelent a vakok közösségének. Steven Scott két konkrét projekten keresztül mutatja be.

Az egyik a Keychron billentyűzetbeállító alkalmazás. A Keychron billentyűzetei népszerűek a látássérültek körében is, de a gyártó saját launcher szoftvere – amellyel a gombokat, rétegeket és funkciókat lehet beállítani – nem hozzáférhető képernyőolvasókkal. Shaun Preece ezért fogott neki, hogy Claude AI-val a semmiből megírjon egy alternatív eszközt. Nyílt forráskódú a protokoll, a billentyűzetkiosztások lekérhetők, az egész elvben megoldható. A folyamat bonyolultabb volt a vártnál – amikor az összes Keychron billentyűzetmodell kiosztásának letöltésébe kezdett, a Claude kifogyott a rendelkezésre álló tokenekből (a feldolgozható szövegmennyiség mértékegysége), és egy adott ponton kilépett a rendszerből –, de az irány egyértelmű.

A másik projekt talán még érzékletesebb. Steven Scott webkameráját egy gimbal (képstabilizáló eszköz, amely a kamera mozgását egyensúlyban tartja) tartja, és a kamera pásztázható, dönthető, zoomolható. A gyártó szoftvere ehhez teljesen hozzáférhetetlen. Steven vibe codinggal épített egy saját vezérlőeszközt, amely becsatlakozik a kamera hardveréhez, és lehetővé teszi a teljes vezérlést. Ha Shaun Preece a képből kicsúszik, Steven most már korrigálni tudja a beállítást. Ezzel párhuzamosan bebizonyosodott, hogy a gyártó szoftvere akadálymentesíthetővé tehető lett volna – nem kellett volna hozzáférhetetlennek maradnia.

A vibe coding útjára lépni sem magától értetődő. Shaun Preece saját bőrén tapasztalta meg, hogy az Apple fejlesztői fiók létrehozásához az egyetlen elérhető azonosítási lehetőség a vezetői engedély volt – ami vak személynek értelemszerűen nem áll rendelkezésre. Ez nem egyedi eset: az akadálymentesítés hiánya nem csak a kész szoftverekben jelenik meg, hanem a fejlesztői ökoszisztéma belépési pontjain is. Maga a folyamat, amellyel valaki megpróbálná kijavítani ezeket a hiányosságokat, újabb akadályokba ütközik.

—

Claude mindenütt: Ableton-tól Xcode-ig

A Claude AI beépülése különböző alkotóeszközökbe az adás egyik visszatérő mellékszála. Az Ableton (professzionális digitális audio munkakörnyezet, röviden DAW, amelyet hangfelvételhez, zeneszerkesztéshez és hangkeveréshez használnak) bejelentette, hogy a Claude-ot integrálják a szoftverbe. Ez nem azt jelenti, hogy az AI átveszi a hangmérnök munkáját, de segítséget, útmutatást és automatizálást hoz a zeneszerkesztésbe.

Hasonló a helyzet a Blender nevű háromdimenziós animációs szoftvernél és az Xcode-nál, amely az Apple alkalmazásépítő fejlesztői környezete. Az utóbbi különösen érdekes: a Claude nem tudja átvenni az irányítást az interfész felett, de szinte egyenrangú asszisztensként vezeti végig a fejlesztőt. Steven Scott arról számol be, hogy a Claude képernyőolvasó-tudatos instrukciókkal dolgozik: nem azt mondja, hogy „kattintson ide”, hanem azt, hogy „a VoiceOver ezt fogja felolvasni, ez az a lehetőség, amelyet ki kell választani.” Ez az a fajta kontextuális érzékenység, ami a szokásos fejlesztői dokumentációból szinte teljesen hiányzik.

A Claude Code – a Claude terminálalapú változata, amely a felhasználó számítógépére írhat és onnan olvashat fájlokat – egy lépéssel tovább megy. Ez az eszköz lehetővé teszi, hogy mélyebb kutatást végezzen, fájlokat hozzon létre és módosítson, sőt bizonyos esetekben online műveleteket is elvégezzen. Steven le is szögezi: ez kényelmes, de odafigyelést igényel. Az AI egyszer véletlenül törölt egy fájlt egy csatlakoztatott szerveren, majd önmagát korrigálva visszaállította azt. Praktikus – de a hatáskör tudatos szabályozása nélkül kockázatos is.

—

Elég nagy ahhoz, hogy befizessen, de nem elég nagy ahhoz, hogy bojkottáljon

A vibe coding valódi tétjét nem a technikai részletek mutatják meg, hanem a piaci és közösségi következmények. Shaun Preece foglalja össze a látássérültek közösségének strukturális dilemmáját: elég nagy ahhoz, hogy pénzt vigyen a cégekhez, de nem elég nagy ahhoz, hogy a bojkottjuk érzékelhetően befolyásolja a vállalatok bevételét.

Ez az aszimmetria évtizedek óta meghatározza az akadálymentesítési harcokat. Az érintett közösségek szólhatnak, lobbizhatnak, leveleket írhatnak – ám amíg ez nem érinti a vállalat mérlegét, a változás esetleges és lassú. Az AI-eszközök ebben a kontextusban nem pusztán kényelmi eszközök, hanem a tárgyalási pozíció megváltoztatásának eszközei.

Ha egy vak felhasználó – nulla kódolási előképzettséggel – képes hozzáférhető alternatívát építeni egy hozzáférhetetlen szoftverhez, akkor az az üzenet, amelyet a gyártónak küld, egyszerre szakmai és gazdasági. Steven ki is mondja: ha egy fejlesztő azt állítja, hogy valamit nem lehet hozzáférhetőbbé tenni, majd egy felhasználó megcsinálja Claude-dal, ez nem kényelmetlenség – ez szégyen. A Logitech Options Plus és a Keychron launcher mellett a Roadcaster nevű hangkeverő eszköz is szóba kerül az adásban, mint olyan hardver, amelynek szoftvere annyira zárt, hogy közvetlen alternatíva nem írható hozzá. Steven üzenete a gyártónak egyértelmű: ha az akadálymentesítés nem fér bele a fejlesztési tervbe, legalább egy nyílt API-t (alkalmazásprogramozási felületet, amelyen keresztül külső fejlesztők is csatlakozhatnak a rendszerhez) kellene biztosítani – és a közösség elvégzi a munkát.

Steven hozzáfűzi: az akadálymentesített felhasználói felület nem a vakok megrövidített verziója az igazi szoftvernek. Sokszor a legtisztább, legjobban navigálható megoldás, amelyet a látó felhasználók is örömmel használnak. Az elvárás nem az, hogy a vak felhasználóknak külön bejárat járjon – hanem az, hogy a főbejárat mindenki számára átmenjen.

—

Ki fog elveszni a dömpingben?

Az adás végén felmerül egy ellenpont is. Ha mindenki képes lesz alkalmazásokat és eszközöket gyártani AI-val, mi lesz a minőségi szűrővel? Steven az App Store korai napjait idézi: a Zippo-öngyújtó szimulátortól a hangeffektus-gombokon át rengeteg haszontalanság töltötte fel az áruházat, mielőtt a piac önmaga rendezte a prioritásokat. Az akkori fölöslegesnek tűnő alkalmazások valójában a technológia határait tapogatták – az öngyújtós app az okostelefon giroszkópját és gyorsulásmérőjét demonstrálta.

A vibe coded alkalmazások tömkelege valószínűleg hasonló utat jár be. A közösségen belüli 15 párhuzamos Keychron-megoldás egyelőre nem probléma – idővel a legjobb kerül a felszínre, a többit elfelejtik. Az ígéret ennél is nagyobb: ha a blind-first fejlesztés – azaz a vakokat előtérbe helyező szoftverfejlesztési szemlélet – valóban terjed, ha a vak fejlesztők saját megoldásaikat értékesítik is, az egy olyan munkapiaci lehetőség, amelyet a mesterséges intelligencia nem szűkít, hanem éppen megnyit.

—

Ami a Double Tap-adásban egy AI-dal és egy előző adásbeli apró baklövés (Shaun Preece a felvétel közepéről kellett sietnie a lánya születésnapi partijára) köré szerveződik, valójában egy mélyebb tézis körvonalait rajzolja ki: az AI-eszközök nem pótolják az emberi alkotást, de felszámolnak néhány olyan falat, amelyek mögé az ipar évtizedek óta el tudta rejteni a hanyagságát.

A cikk a Double Tap podcast 2026. május 5-i adása alapján, AI felhasználásával készült, ezért apróbb pontatlanságokat tartalmazhat.