Oldal frissítése

Mesterséges intelligencia és hangvezérlés

Publikálva • Szerző: Michal Rybka

Ahogy fejlődnek az új technológiák, úgy jelennek meg az új vezérlési formák is. A hangvezérlés olyan technológia, amelyet tulajdonképpen minden sci-fi szerző előre jelzett: hiszen mennyire intuitív és egyszerű emberi hangon beszélgetni a számítógéppel! Hangvezérléssel találkozunk Kubrick 2001: Űrodüsszeia (1968) című művében, ahol a gyalázatos számítógép nemcsak hogy megtagadja az emberi utasítások teljesítését, hanem kamerák segítségével még megpróbálja leolvasni az emberek szájáról is, miről beszélnek vele kapcsolatban. Stanisław Lem Pirx pilóta történetei című művében (1966) a számítógép ugyan kattognak a reléi, de képes felismerni a hangutasításokat és válaszolni rájuk. A hang egyszerűen intuitív dolog, ezért mindenki arra számított, hogy a hangvezérlés hamar megjelenik.

Hangvezérlés AI
Kép forrása.

A jövő: mesterséges intelligencia és hangvezérlés – TARTALOM

  1. A hangfelismerés problémás
  2. A hangvezérlés fejlődése az elmúlt években

A hangfelismerés problémás

Csakhogy itt jön a bökkenő! Míg a hangszintézis viszonylag egyszerű feladat – vagyis ha nem ragaszkodsz ahhoz, hogy természetesen hangozzon –, a hangfelismerés már összetett probléma. Régóta dolgoznak rajta: egészen pontosan 1952-ben jelent meg az Audrey rendszer, amelyet a Bell Labs fejlesztett ki, és képes volt a hanggal bemondott számjegyek felismerésére. Az 1962-es Seattle World Fair kiállításon az IBM bemutatta a Shoebox projektet, vagyis egy olyan gépet, amely tizenhat szót tudott felismerni. Hátránya az volt, hogy minden egyes beszélőre külön be kellett állítani – valljuk be, néha az embereket is nehéz megérteni, még akkor is, ha te magad is ember vagy.

A hetvenes években az amerikai DARPA is bekapcsolódott, és úgy döntött, támogat egy olyan programot, amelynek eredménye egy olyan gép lenne, amely legalább ezer szót képes megtanulni felismerni. Ezt sikerült teljesíteni, de a fejlődés nem ment túl gyorsan, még a 80-as évek közepén is az IBM Tangora projektje számított a legjobbnak, amely húszezer szót tudott felismerni. Az AI fejlődésének köszönhetően a gép már képes volt megbecsülni annak valószínűségét, hogy az a hang, amelyet nem tudott pontosan felismerni, egy szó része.

i

A számítógépek története

1990-ben végre megjelent a Dragon Dictate, az első kereskedelmi diktálásfelismerő rendszer, amely azonban jól artikulált beszédet és a szavak egyértelmű elkülönítését igényelte. Csak 2002-ben jelent meg a beszédfelismerés mint a Microsoft Office szabványos része. A beszédfelismerés számára óriási előrelépést jelentett az internet. Lehetővé tette olyan szolgáltatások létrehozását, amelyeknél a program bármikor csatlakozhatott a szerverhez egy fel nem ismert hangsorozattal, amelyet aztán a rendszer további tanítására használtak fel. A visszacsatolás a mesterséges intelligencia fejlődésének fontos része, és lehetővé teszi annak továbbfejlesztését. Ezért nem meglepő, hogy a Google volt az, aki először vezette be a hangvezérlést mobileszközökre 2008-ban.

A hangvezérlés fejlődése az elmúlt években

Abban az időben már minden nagy szereplő készítette a saját technológiáját. Az Apple 2011-ben jelentette be a Siri technológiát, a Microsoft 2014-ben bevezette a Cortanát, és ugyanebben az évben az Amazon bemutatta az Echo technológiát az Alexa nevű otthoni asszisztenséhez. Ezek a technológiák egyfelől kissé ijesztőek, mert az otthoni eszközök tulajdonképpen „egy kicsit mindig figyelnek”, ugyanakkor rendkívül egyszerű parancsbevitelt tesznek lehetővé, még akkor is, ha „tele van a kezed”, így valójában a személyes asszisztensed szerepét töltik be.

Siri
A Siri asszisztens az Apple ökoszisztémájának közismert része.

A hangvezérlés sikeréhez kulcsfontosságú a mesterséges intelligencia fejlődése, vagyis az a képessége, hogy nagy mennyiségű adatból tanuljon, és bizonytalan információkkal is tudjon dolgozni. A modern AI jelentős mértékben érti a beszélgetés kontextusát, így a parancsok kiadása helyett inkább egyfajta párbeszédet folytatsz az eszközzel. Feltehetsz kiegészítő kérdéseket, de akár szórakozást is kérhetsz az asszisztensedtől, vagy megkérheted, hogy mondjon egy viccet. Ez már valóban közel áll a sci-fi szerzők elképzeléseihez!

A vezérlés fejlődése azonban nem ér véget a hangfelismerésnél. A következő lépés a képalapú és egyéb adatokra támaszkodó vezérlés lesz, ami elengedhetetlen az autonóm járművek fejlesztéséhez. Ezeknek nagyon összetett információkat kell feldolgozniuk, beleértve a közlekedési táblák felismerését is, és számos autonóm döntést kell hozniuk. Egyszerűbben fogalmazva azt mondhatjuk, hogy a gépek vezérlésének jövője valójában abban rejlik, hogy már nem lépésről lépésre fogjuk őket irányítani, hanem nagyrészt önálló döntéshozatalra bízzuk őket.

i Ezek a cikkek is érdekelhetnek:

Már a korai sci-fikben is megjelent az az elképzelés, hogy a jövő számítógépeit nem programozni fogják, csak megadják nekik a feladatot, és ők mindent önállóan megoldanak. Ettől a szinttől egyelőre még messze vagyunk, de már most is rengeteg feladatot képesek a gépek kis segítséggel vagy felügyelet mellett elvégezni. Közben megjelennek a kibővített funkcionalitású háztartási gépek is: ma már megszoktuk, hogy az automata mosógép mindent elintéz magától, de mi lenne egy olyan konyhai robotgéppel, amely nagyrészt önállóan főz? Te kiválasztod az ételt, ő megmondja, milyen hozzávalókra van szüksége, mikor kell hozzáadnod őket – és a munka nagy részét elvégzi helyetted!

Próbáld ki a sütijeinket

Mi, az Alza.hu Kft., azonosítószám: 27082440, sütiket használunk a weboldal működőképességének biztosításához, és a beleegyezéseddel weboldalunk tartalmának személyre szabásához is. Az "Értem" gombra kattintva elfogadod a sütik használatát és a weboldal viselkedésével kapcsolatos adatok átadását a célzott hirdetések megjelenítésére a közösségi hálózatokon és más weboldalakon található hirdetési felületeken.

További információ
Értem Részletes beállítások Elutasít mindent
P-DC1-WEB15