A Double Tap podcast legújabb adásában szóba kerül egy frissen megjelent on-device átírószoftver, a Meta okosszemüveg-kínálatának bővítése, az Apple mesterséges intelligencia-stratégiájának változása – és négyszáztizenháromezer eltűnt KitKat.
Négyszáztizenháromezer KitKat szelvényes csokoládé tűnt el egy olasz–lengyel szállítmányból – az ügyet körüllengő gyanú Stephen Scottra vetett árnyékot, aki azonban határozott alibire hivatkozik. A hét fontosabb tech-hírei ettől függetlenül terítékre kerültek a Double Tap-en: megérkezett egy új, on-device átírószoftver, a Meta két új okosszemüveg-modellt készül piacra dobni, az Apple mesterséges intelligencia felé vezető útja pedig egyre kevésbé lineárisnak tűnik.
Ellopott csokik, drágább konzolok
A hét elején a sajtót bejárta a hír: Olaszországból Lengyelország felé tartó szállítmányból eltűnt pontosan 413 793 KitKat. A Nestlé közleménye mérsékelt dühöt és különös humort vegyített: a vállalat elismerte a tolvajok „kivételes ízlését”, de hangsúlyozta, hogy a rakománylopás egyre komolyabb probléma. Az egyes tételek egyedi batch-kódok alapján nyomon követhetők, így az esetlegesen forgalomba kerülő áru elvben azonosítható.
A hét másik árhíre a Sony PlayStation 5 drágulásáról szólt: a konzol ára közel 90 dollárral nőtt, amit a gyártó az alkatrészköltségek emelkedésével indokolt.
Az értekezletátirat problémája
Stephen Scott az adásban hosszabban foglalkozik azzal a problémával, amellyel sok felhasználó szembesül: hogyan lehet megbízhatóan dokumentálni az értekezleteken elhangzottakat? A piacon elérhető megoldások döntő többsége felhőalapú feldolgozást igényel – a hanganyag egy külső szerverre kerül, ott dolgozzák fel, majd az összefoglaló visszaérkezik a felhasználóhoz. Ez adatvédelmi szempontból sok egyéni felhasználónak és szinte minden vállalati környezetnek aggályos: az IT-részleg aligha engedélyezi, hogy bizalmas megbeszélések hanganyaga elhagyja a szervezet rendszereit.
A helyzetet az is bonyolítja, hogy az Apple Watch Ultra akciógombja kényelmes felvételindítót ad, a hanganyagot aztán be lehet tölteni a ChatGPT-be, és onnan megkapható az átirat – de az egész folyamat manuális, és szintén felhőbe kerül.
Az egyik hardveres alternatíva a Plaud NotePin (és a hasonló Plaud Note), amelyek mágnesesen rögzíthetők az iPhone hátlapjára egy MagSafe-kompatibilis tartón keresztül. Az eszköz nemcsak a hangszórón keresztül rögzít: a telefonhoz tapasztva, fülhöz tartva is felveszi a hívásokat. A saját alkalmazásban aztán megjelenik az átirat és az összefoglaló. Az ár az Egyesült Királyságban 160–170 font körül mozog, de a teljes funkcionalitáshoz előfizetés is szükséges, és ismert akadálymentesítési problémák mutatkoznak – ez utóbbi szempont sok felhasználónál döntő lehet.
Perspective Transcribe: a fejlesztők vakok
Az adás napján érkezett az App Store-ba a Perspective Transcribe, a Perspective Intelligence alkalmazáscsomag legújabb tagja. Fejlesztői, Michael Doise és Taylor Arndt maguk is vakok – ez magyarázza, hogy az alkalmazás eleve teljes körűen akadálymentes, nem utólagos kiegészítésként.
Az alkalmazás az Apple saját alapmodelljeire épít, és a feldolgozás teljes egészében a készüléken zajlik. Semmi nem kerül felhőbe, a hangfelvétel és az abból készülő átirat, illetve összefoglaló kizárólag a telefonon marad. Ez az on-device megközelítés nemcsak adatvédelmi szempontból előnyös, hanem munkahelyi használatra is alkalmassá teszi, ahol a felhőalapú megoldások sokszor tiltólistán vannak.
A felvétel leállítása után az app automatikusan elkészíti az átiratot és az összefoglalót, amelyek utólag kereshetők is. Az alapfunkciók előfizetés nélkül elérhetők, így az alkalmazás kockázat nélkül kipróbálható. A fizetős „all access” csomag ára hozzávetőlegesen havi 6 dollár (a pontos ár a megjelenéskor nem volt publikus), és lehetővé teszi külső hangfájlok importálását, valamint néhány kiegészítő funkciót. A fejlesztők Mac-es verziót is terveznek, ami Zoom-értekezleteken is megnyitná a lehetőségeket.
Google Meet és a Gemini-integráció
Aki értekezleteihez a Google Meet platformot használja, már most rendelkezésre álló megoldáshoz juthat: a Gemini beépített funkción keresztül, egyetlen jelölőnégyzet aktiválásával kérhető, hogy az értekezlet végén összefoglaló és átirat kerüljön egy megosztott Google-dokumentumba, az összes résztvevőhöz.
Ennek van egy komoly előnye a Zoom és hasonló platformok AI-botjaival szemben: a Gemini nem jelenik meg külön résztvevőként az értekezletszobában. A Zoom-alapú megoldásoknál egy automatizált bot csatlakozik a megbeszéléshez – ez egyre erősebb ellenállást vált ki. Sokan kifogásolják, hogy a résztvevők erre hivatkozva figyelmen kívül hagyják a megbeszélést, és az is zavaró, hogy egy nyilvánvalóan rögzítő entitás figyeli az érzékeny szakmai párbeszédet.
A megosztott Google-dokumentum formátum egyébként közvetlenül felhasználható: a találkozó után az összes résztvevő hozzáfér, és teendőkre is hivatkozhat.
Az Apple AI-stratégiája
Az adásban felvetődik a kérdés, hogy az Apple valójában milyen irányt követ a mesterséges intelligencia terén. Az Apple Intelligence bevezetésekor sokat ígért, de keveset teljesített – ez közhely a platformot nyomon követők körében. Ami most változni látszik: a vállalat egyre inkább harmadik felek modelljeit integrálja.
A ChatGPT után a Google Gemini is bekerül az ökoszisztémába: ha a Siri vagy az Apple Intelligence nem tud választ adni, átadja a feladatot. Sajtóhírek szerint az Apple ezt a nyitást más AI-motorokra is kiterjesztheti. Felmerül, hogy ez tudatos stratégiai döntés: az Apple talán belátta, hogy saját nagy nyelvi modell fejlesztése szükségképpen ütközne az adatvédelmi politikájával, ezért inkább az infrastruktúrát tartja meg, a modelleket pedig külső forrásból szerzi.
Párhuzamosan arról is hírek érkeztek, hogy a Google a Gemini modellt kisebb, on-device futtatásra alkalmas darabokra bontja. Ez illeszkedik egy szélesebb iparági tendenciához: ha az AI-feldolgozás a készüléken belül zajlik, szerver nélkül, azzal mind a késleltetés, mind a működési költség csökken. A Meta okosszemüveg-ökoszisztémájának fejlődése éppen ebbe az irányba mutat: ha az AI-alkalmazások a telefonon futnak, nem pedig egy felhőszerveren, az energiaigény és az adatvédelmi kockázat egyaránt kisebb.
Meta Ray-Ban: dioptriás lencséhez tervezett modellek
A Bloomberg értesülései szerint két új Meta Ray-Ban okosszemüveg-modell van fejlesztés alatt, amelyeket kifejezetten dioptriás lencse viselőknek terveztek. A The Verge az FCC-nél (az amerikai Szövetségi Hírközlési Bizottságnál) benyújtott iratok alapján azonosította a Scriber és Blayzer belső kódnevű eszközöket; az iratokban „gyártási egységekként” szerepelnek, ami általában a közelgő piaci megjelenés jele. A két modell eltérő keretformában érkezik – szögletes és lekerekített változatban –, hagyományos optikai értékesítési csatornákon keresztül.
A jelenlegi Meta Ray-Ban keretébe elvben el lehet helyezni dioptriás lencsét, de egyes optikusok a keret geometriája vagy az egyéni korrekcióigény miatt nem tudják elvégezni a cserét. Az új modellek ezt az akadályt igyekeznek csökkenteni. Kijelzőt egyik modell sem kap – ez a szeptemberi MetaConnect rendezvényig valószínűleg várat magára.
Az akkumulátor tartóssága egyre égetőbb kérdés a Ray-Bannél: a harmadik féltől letöltött, AI-t használó alkalmazások – főleg azok, amelyek folyamatos feldolgozást igényelnek – komolyan csökkentik az üzemidőt. Ezért egyre inkább kézenfekvő az EchoVision (az AGIGA szemüvege) megközelítése: USB-C csatlakozóval rendelkezik, ami menet közben is tölthetővé teszi az eszközt – ez a lehetőség a Ray-Banből jelenleg hiányzik. Az EchoVision egyébként az Aira– és a Be My Eyes-kisegítő szolgáltatásokat is integrálja.
Az adásban elhangzik egy megfigyelés is: a Meta Ray-Ban platformra rövidesen megjelenő alkalmazások döntő többsége kifejezetten vakok és gyengénlátók számára készül. Ilyen koncentrált akadálymentesítési fókusz ritka egy ilyen léptékű mainstream fogyasztói platformon.
Okosvilágítás: Philips Hue és a Lepro orb
Kisebb tech-témaként az adásban szóba kerül a stúdió átrendezése és az okosvilágítás. Stephen Scott tévesen hitte, hogy az új gömb alakú okoslámpa Govee-termék – kiderült, hogy a Lepro márkáé. A Govee-hoz hasonlóan ez is egy okosvilágítási márka, amelynek applikációja akadálymentesítési szempontból nem teljesen megbízható. A megoldás: ha az eszköz összeköthető Alexa-skillel, Google Home-mal vagy HomeKit-tel, az applikáció hiányosságai többnyire kikerülhetők. A Lepro gömb a Matter protokollt nem támogatja, amit Sean Preece a bővebb akadálymentesítési kompatibilitás szempontjából fontosnak tart.
A Philips Hue kapcsán szóba kerül a nystagmusos (kénytelen szemmozgással élő) felhasználók tapasztalata: az olcsóbb LED-izzók villogása – amelyet sokan nem érzékelnek – számukra komoly problémát jelenthet. A Philips Hue izzók ebből a szempontból megbízhatóbbak, és hét-nyolc év után is működnek, ami hosszabb távon kompenzálja a magasabb beruházási költséget.
Hallgatói levelek: Calibre, paratransit és VoiceOver
Az adás utolsó harmadát hallgatói visszajelzések töltik ki, amelyek néhány korábbi tévedést korrigálnak.
Hedy a speciális közlekedési szolgáltatással (paratransit) kapcsolatban pontosít: az előfoglalási határidő 24 óra, nem három nap. A háromnapos határidő a Medicare és Medicaid által finanszírozott utakra vonatkozik – ezek ingyenesek, de csak gyógyszertárhoz, bankhoz és hasonló célpontokhoz igénybe vehető utazásokra. A paratransit viteldíja jelenleg 4,50 dollár utazásonként, és egy irányban legalább egy óra benntartózkodást írnak elő.
Frank a Victor Reader Stream DAISY-könyv-letölthetőségének ügyét hozza szóba: az RNIB és a Humanware közötti tárgyalások az integrációról évek, sőt egyes esetekben évtizedek óta húzódnak érdemi eredmény nélkül. A Victor Reader Stream egy Humanware által gyártott hangoskönyv-lejátszó, amely DAISY (Digital Accessible Information System – digitális akadálymentes formátum) könyveket kezel; az RNIB kölcsönkönyvtárának anyagát egyelőre csak számítógépen lehet letölteni. Frank azt is jelzi, hogy az iPhone VoiceOver-sebesség beállítása 50 és 40 százalék között egyetlen lépéssel ugrik – a forgó vezérlőn (rotor) keresztül azonban finomabb hangolás lehetséges.
A leghevesebb levelet „negatív Julian” küldte, aki éles kritikával illeti a műsorvezetőt, amiért azt állította, a Calibre hangoskönyvtár anyagát kizárólag önkéntesek olvassák fel. Julian pontosít: a brit hangoskönyvtár már régóta professzionálisan rögzített felvételeket is tartalmaz. Megtalálható benne a Harry Potter-sorozat Stephen Fry hangján, az Agatha Raisin-könyvek Penelope Keith tolmácsolásában, valamint Agatha Christie-regények Hugh Fraser felolvasásában – aki a klasszikus Poirot sorozatban Hastings kapitányt alakította. Az adásban elhangzik az is, hogy a Calibre és az RNIB könyvtára fontos szerepet tölt be azzal, hogy olyan könyveket is elérhetővé tesz hangos formátumban, amelyeket az Audible soha nem adna ki – régi könyveket, helyi szerzőket, kevésbé piacképes kiadványokat.
Összegzés
Az adás visszatérő témája az adatvédelem és az akadálymentesítés összefonódása. A Perspective Transcribe azt kínálja, amit sokan keresnek: helyi feldolgozást, akadálymentes kezelőfelületet, adatvédelmi garanciával. A Meta Ray-Ban dioptriás változatai és az Apple AI-stratégiájának átalakulása egyaránt azt jelzik, hogy a kisegítő technológia és a mainstream fogyasztói piac közötti határ egyre inkább eltűnik.
A cikk a Double Tap podcast 2026. március 31-i adása alapján, AI felhasználásával készült, ezért apróbb pontatlanságokat tartalmazhat.