Vibe coding vakon: amikor az AI megcsinálja, amit a fejlesztő nem tudott

A látásromlással sok mindent elveszített Steven Scott – köztük azt az örömöt, hogy csak úgy leüljön a számítógép elé és alkotni kezdjen valamit. Aztán jött a vibe coding.

A Double Tap podcast két műsorvezetője, Steven Scott és Shaun Preece nemrég olyan témát vett elő, amely a látássérült technológiai közösségben egyre nagyobb figyelmet kap: a mesterséges intelligencia segítségével történő alkalmazásfejlesztést, amelyhez egyetlen sor kódot sem kell írni – sőt érteni sem. A vibe coding nem új fogalom, de hogy mit jelent egy képernyőolvasót (screen readert) használó, programozásban teljesen járatlan ember számára, azt Steven Scott legutóbbi tapasztalatai mutatják a legszemléletesebben.

Mi az a vibe coding, és miért más vakon?

A fogalom lényege egyszerű: ahelyett, hogy a felhasználó megtanulna programozni, természetes nyelven leírja egy AI-nak, mit szeretne elérni, majd a rendszer megírja helyette a kódot. A ChatGPT, a Google Gemini, a Microsoft Copilot és az Anthropic Claude egyaránt alkalmasak erre – az eredmény minősége azonban attól is függ, mennyire pontosan fogalmazza meg a felhasználó a problémáját.

Ez az a pont, ahol a látássérült felhasználók sajátos előnnyel indulnak. Aki naponta szembesül azzal, hogy egy alkalmazás valamely eleme nem érhető el képernyőolvasóval, pontosan tudja leírni a problémát. Nem kell senkinek elmagyarázni, mi hiányzik – a fájdalom ismert, a kívánt megoldás megfogalmazható. Scott szerint ez az önismeret kulcsfontosságú: „A vak fejlesztő jobban ismeri a fájdalompontokat, mint a látó programozó, akinek el kell magyarázni, mit jelent billentyűzettel navigálni.”

A Farrago-projekt: tíz menetváltás egy működő szkriptig

A kiindulópont egy hétköznapi bosszúság volt. Scott a Double Tap műsorhoz egy soundboardot, azaz hangeffekt-lejátszó programot használ – a Farrago-t, amelyet a Rogue Amoeba fejleszt. A szoftver Mac-en fut, és a VoiceOver (az Apple beépített képernyőolvasója) segítségével kezelhető – egy kivétellel: nem jelzi a lejátszás alatt lévő hangfájl hátralévő idejét. Az információ vizuálisan látható, de VoiceOver-rel egyetlen fókuszálható elem sem közli. Scott több alkalommal is jelezte a fejlesztőnek a problémát, megoldás mégsem született.

Ezért fordult a Claude-hoz – az Anthropic AI-asszisztensének webes felületéhez. A prompt nem volt bonyolult: leírta a szoftvert, a problémát, a kívánt megoldást, és azt, hogy VoiceOver-t használ, billentyűzettel dolgozik, egeret nem nyúl. Az AI először egy AppleScript-kódot adott, amelyet a Mac beépített Script Editor alkalmazásába kellett beilleszteni és futtatni – majd a kapott eredményt visszamásolni a Claude ablakába. Scott bevallja, hogy a „Command+F kereső nem működik a Script Editorban” ponton majdnem feladta, de ahelyett, hogy a problémán rágódott volna, egyszerűen visszamásolta a teljes kimenetet az AI-nak, ezzel a megjegyzéssel: „Fogalmam sincs, mit jelent ez, de itt van.”

A Claude ebből kinyerte, amit keresett, és egy Automatorba – a Mac régóta meglévő automatizálási eszközébe – illeszthető szkriptet adott vissza, amelyhez billentyűparancsot is lehetett rendelni. Körülbelül tíz menetváltás következett: jogosultsági problémák, téves elemfelismerés (a szkript egy hangfájl teljes hosszát adta vissza a hátralévő idő helyett), majd a VoiceOver helyett a rendszerhang használatára való átállás. Végeredmény: egy működő billentyűparancs, amely bemondja a lejátszás alatt álló hangfájl hátralévő idejét – pontosan és megbízhatóan. „Nem hittem el, hogy meg tudom csinálni” – mondta Scott. „Pedig meg tudtam.”

NVDA Item Chooser: vacsora megrendelése közben, telefonon diktálva

A másik projekt már az iPhone-on zajlott, vacsoravárás alatt. Az NVDA (NonVisual Desktop Access, a legelterjedtebb nyílt forráskódú képernyőolvasó Windowson) egyik hiányossága Scott szerint, hogy nem rendelkezik olyan kényelmes elemkeresővel, mint a VoiceOver Item Chooser Mac-en. Ez utóbbi egyetlen billentyűparanccsal előhív egy párbeszédablakot, amelybe beírva bármit azonnal szűrhetők az aktív ablak elemei – gombok, mezők, hivatkozások –, majd az adott elemre lehet lépni vagy aktiválni.

Miközben az ételt várta, Scott telefonon diktálta a problémaleírást a Claude-nak – az iPhone diktálójával, amelynek teljesítményéről lesújtó véleménye van. A szöveg tele volt hibákkal; az AI-t arra is megkérte, hogy nézze el a pontatlan átírást. „Megkaptam a lényeget” – volt a válasz.

A kísérlet eredménye nem pár sor magyarázat lett, hanem egy kész .addon kiterjesztésű fájl – az NVDA-bővítmények natív formátuma –, amely azonnal telepíthető volt. Az első verzió betöltési hibával indult, a második azonban már működött: az NVDA+I billentyűkombinációra megjelenik egy párbeszédablak keresőmezővel, az elemek listájával, és két gombbal – „Ugrás az elemre” és „Ugrás és aktiválás”. Scott a harmadik verziónál tart; a billentyűparancsban az „I” betűt maga az AI választotta az „Item Chooser” kezdőbetűjeként.

A módszertan: mit érdemes tudni, mielőtt belevágnál

Scott tapasztalatai alapján néhány módszertani tanulság körvonalazódik. A legfontosabb: minél több kontextust kap az AI, annál pontosabb a kimenet. Érdemes megnevezni a képernyőolvasót (VoiceOver, NVDA, JAWS stb.), jelezni, hogy az interakció kizárólag billentyűzettel történik, és elmagyarázni az akadálymentességi szempontokat. A látásállapot részletezése nem szükséges – elég annyit közölni, hogy a felhasználó vak, és képernyőolvasót használ.

A másik tanulság: az iteráció természetes. A végeredmény nem az első promptra születik meg. Scott mindkét projektnél több körön ment át, hibaüzeneteket és képernyőképeket is visszacsatolt az AI-nak. A Claude nem kérdezett vissza – maga kereste a megoldást, és ha egy lépés nem működött, Scott leírta, mi történt, az AI pedig alkalmazkodott.

A Claude-ot Scott a claude.ai weboldalon keresztül használta; a desktop alkalmazást kevésbé találta hozzáférhetőnek. Az ingyenes csomag tokenlimitje hamar elfogyott – az app fejlesztésekor egyetlen munkameneten belül elérte a napi korlátot, és órákat kellett várni a folytatásra. Végül a fizetős Max csomagra váltott, amely havi 80 fontba kerül, és bármikor lemondható.

Kódminőség, felelősség, az NV Access aggályai

A lelkesedés mellé kijózanító kérdések is tartoznak. Az NVDA bővítménytárát gondozó NV Access szervezet egyre inkább aggódik a vibe-kódolt bővítmények elterjedése miatt – nem tiltja, de próbálja visszaszorítani őket. A félelem nem alaptalan: aki nem néz bele a kódba, fogalma sincs, mit csinál valójában a futtatott program. Esetleg feleslegesen sok erőforrást köt le. Esetleg adatot gyűjt. Esetleg biztonsági rést tartalmaz egy elavult, AI által felhasznált forráskódból.

Scott maga sem tekintett bele a létrehozott kódba – ez volt számára a vibe coding lényege. Épp ezért döntött úgy, hogy az Item Chooser bővítményt nem teszi közzé. Elküldte Shaun Preece-nek tesztelésre, és felajánlotta, hogy ha egy valódi fejlesztő ellenőrizni és publikálni szeretné, szívesen átadja. Nyilvánosan terjeszteni – nem.

A vitának van egy tágabb dimenziója is. Az Apple App Store-ba beküldött alkalmazások száma 84 százalékkal nőtt az AI-eszközök elterjedése óta, ami jelentős késedelmet okoz a legitim alkalmazások jóváhagyásában. Az NVDA bővítménytára hasonló nyomás alá kerülhet, ha a vibe coding valóban tömegessé válik.

Visszanyert öröm

Van egy személyes szál is, amely az egész technikai fejtegetés mögött húzódik. Scott elmondta, hogy régóta nem volt olyan projektje, amelybe kedvből vetette volna magát – amely nem munkakötelezettség volt, hanem tiszta öröm. A látásállapotának romlásával sok minden, ami korábban szórakoztató volt – audio projektek, kreatív kísérletezés –, fokozatosan eltűnt. A számítógép egyre inkább munkaeszközzé vált, semmi mássá.

Ez a pár álmatlan éjszaka megváltoztatta ezt. Nem azért, mert Scott megtanult programozni. Hanem azért, mert megoldott valamit, ami hónapok óta bosszantotta, és közben kiderült: egy vak ember, aki pontosan tudja, mit akar, és le tudja írni, milyen eszközzel dolgozik, képes olyat létrehozni, amit a szoftver hivatalos fejlesztője mindeddig nem szállított – függetlenül attól, hogy a kódot végül ki írta.

—

A cikk a Double Tap podcast 2026. április 16-i adása alapján, AI felhasználásával készült, ezért apróbb pontatlanságokat tartalmazhat.