Wispr Flow: hangod helyett gépel az AI

Az okostelefonos szövegbevitel régóta megoldatlan kihívást jelent azok számára, akiknek a gépelés fájdalmas, lassú vagy fizikailag nehézkes. A Wispr Flow erre kínál Androidon is elérhető alternatívát: mesterséges intelligenciával megtisztított, azonnal használható szöveget diktál bármely alkalmazásba.

A beépített hangrögzítő funkciók többsége mindent leír, amit mondunk – töltelékszavakkal, önjavításokkal, félbehagyott mondatokkal együtt. A Wispr Flow nem egyszerűen átírja a hangot, hanem értelmezi: kiszűri az „ööö” és „hm” típusú betoldásokat, kezeli az újrakezdett mondatokat, és a végeredmény olyan szöveg, amelyet nem kell utólag átfésülni. A fejlesztők szerint pontosan ez különbözteti meg a platformba épített diktálási megoldásoktól.

Kinek szánják, és mire jó valójában?

A fejlesztők elsősorban azokat célozzák, akiknek a gépelés valamilyen akadályt jelent – legyen szó Parkinson-kórról, ízületi gyulladásról, RSI-szindrómáról, diszlexiáról, ADHD-ról, dadogásról vagy látássérülésről. A 40 százalékos akadálymentességi kedvezmény, amelyet fogyatékossági igazolvánnyal lehet igényelni, szintén ezt a célcsoportot erősíti meg. Időseknek és nonprofit szervezeteknek szóló kedvezményes előfizetés is elérhető.

Az alkalmazás ugyanakkor korántsem csak speciális igényű felhasználóknak lehet hasznos. Aki zsúfolt metróban válaszol üzenetekre, sétálás közben fogalmaz e-mailt, vagy a munkahelyi megbeszélés után rögzítené a fontos pontokat, az is jól jár vele. A diktálás ChatGPT-ben, WhatsApp-ban, Instagramon, Slackben, Gmailben és elvben bármely más alkalmazásban elvégezhető – a szöveg közvetlenül a kijelölt beviteli mezőbe kerül.

Az alkalmazás több mint száz nyelvet támogat, és a diktálási stílus is állítható: választható egy formálisabb mód, amely következetesen alkalmazza az írásjeleket, illetve egy kötetlen változat, amely inkább a társalgási szövegekhez illik. Egy közelgő frissítésben alkalmazásonként is be lehet majd állítani ezt – az e-mail-kliensben tehát más stílust lehetne megadni, mint a chat-alkalmazásokban. (Windowson ez az opció már elérhető.)

Hogyan illeszkedik az Android-rendszerbe?

A Wispr Flow az Android akadálymentességi szolgáltatásán keresztül működik, amely az operációs rendszer egy speciális, kisegítő technológiák számára fenntartott rétege. Erre azért van szükség, mert az Android nem biztosít normál programozói felületet ahhoz, hogy egy külső alkalmazás érzékelje a beviteli mezők fókuszát, és szöveget illesszen be más appokba.

A fejlesztők részletesen ismertetik, mire használják ezt az engedélyt: beviteli mezők felismerésére, a leírt szöveg beillesztésére, a billentyűzet láthatóságának figyelésére, illetve hibajelentési célokra. Hangsúlyozzák azt is, hogy az akadálymentességi szolgáltatás révén nem gyűjtenek, nem tárolnak és nem osztanak meg személyes adatokat más alkalmazásokból, ha éppen nincs aktív diktálás.

Az akadálymentességi jogosultság és a „más appok felett megjelenítés” engedély együttes használata az akkumulátort is mérsékelten terheli: tesztelés során egy napnyi aktív használat után az alkalmazás mindössze nagyjából 1 százalékos energiafogyasztást mutatott.

A TalkBack képernyőolvasóval – az Android alapértelmezett kisegítő eszközével – az alkalmazás kezelése gördülékenyen megoldható, a felületen és a beállításokban egyaránt.

Mit mutat a valódi használat?

Az alkalmazást angolul és törökül is tesztelték különböző hosszúságú szövegekkel, és az átírás pontossága meglepően magas volt. Az önjavításokat – például „öt órára, nem, inkább hatra” – az AI automatikusan feloldja, és a végeredménybe csak „hatra” kerül. Hasonlóan kezeli a dadogást és a töredékes mondatkezdeteket is: az eredmény nem a tényleges szóhasználatot tükrözi, hanem azt, amit a felhasználó valójában közölni akart.

A diktálás gombja a billentyűzet jobb felső sarkában jelenik meg, és áthelyezhető a kényelmes pozíció szerint – a tesztelő például a jobb oldalból a bal oldalra húzta. A gomb megnyomásával vagy nyomva tartásával indítható a diktálás.

Az alkalmazás jelenleg korai hozzáférési fázisban van: 14 napig 1000 szó diktálható ingyen, majd a keret visszaáll. A fizetős előfizetés a Google Play áruházon keresztül egyelőre nem érhető el; a vásárlás a fejlesztő weboldalán, Stripe-on keresztül lehetséges.

Egy kisebb kellemetlenség azért akad: az Android rendszerszintű értesítése, amely jelzi, hogy „ez az alkalmazás más appok felett jelenik meg”, néha visszatér az elutasítás után is. Mivel ez operációs rendszer szintű üzenet, a teljes letiltására egyelőre nincs ismert megoldás.

Összegzés

A Wispr Flow célirányos eszköz: nem ígér többet, mint amennyit teljesít, és amit teljesít, azt megbízhatóan csinálja. Elsősorban azoknak ajánlott, akiknek a gépelés valamilyen okból nehézkes vagy lassú – de a mindennapos mobil szövegalkotást is érdemi mértékben gyorsíthatja bárkinek, aki kész megszokni a diktálást mint beviteli módot.

A cikk a Wispr Flow: AI Voice-to-Text alapján, AI felhasználásával készült magyar adaptáció, ezért apróbb pontatlanságokat tartalmazhat.

Szólj hozzá!

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük