• Szerző: Peter Vnuk
A Google bemutatta a Gemini 3-at, mint a mesterséges intelligencia fejlesztésének újabb lépcsőfokát, amely már nemcsak egy elméleti modell a blogon, hanem egy általánosan elérhető eszköz. A felhasználóknak lehetőségük van átváltani a Gemini alkalmazásban az új modellre és kipróbálni annak gondolkodását a gyakorlatban.
A Google hivatalos blogja a Gemini 3-at olyan modellként mutatja be, amelynek fokozatosan meg fog jelenni a vállalat legtöbb szolgáltatásában. Tehát nagy valószínűséggel számíthatunk rá az olyan alkalmazásokban, mint a Google Drive, Dokumentumok és Gmail.
Az előző generáció közvetlen utódja, de azzal a különbséggel, hogy már nemcsak a szöveggenerálás teljesítményére összpontosít. Ehelyett arra fókuszál, hogy a modell jobban gondolkodjon, tervezzen és megértse a komplex feladatokat szélesebb összefüggésekben. Nem csoda, hiszen a konkurencia is ebbe az irányba halad, és a technológiai óriás nem engedheti meg magának, hogy lemaradjon.
A cég már régóta egy egységes architektúra felé halad, amely a keresést (nemrég jelent meg benne az AI mód), a Gemini alkalmazást és a dokumentumkezelő eszközöket hivatott hajtani. Éppen a Gemini 3-nak kell betöltenie ezt a szerepet. Úgy tervezték, hogy natívan kezelje a szöveget, képet, hangot és videót egy közös kontextusban. A felhasználónak így nem kell azon gondolkodnia, milyen típusú bemenetet használjon, mert a Gemini 3 egészként érti az információk struktúráját. Ráadásul az előző verziókhoz képest már nem kell különböző almodelleket használnia.
Az új Gemini 3 modell már bemutatásra került, tehát nem olyan technológiáról van szó, amelyre várni kellene. Ennek ellenére még nem mondható, hogy mindenki teljes mértékben használja. Egyes funkciók elérhetősége még bővül, továbbá a teljes bevezetés a szolgáltatások között több hétig vagy hónapig is eltarthat.
A fejlesztők a Gemini 3-nál hangsúlyozzák azt a módot, ahogyan a modell gondolkodik. Egy Thinking (Gondolkodás) nevű módot használ, amelyet a felhasználó pontosan ezzel a kifejezéssel talál meg a Gemini alkalmazásban mobilon és böngészőben egyaránt. Aktiválása után a modell a válasz előtt egy pillanatra megáll, és láthatóan gondolkodik. Ez egy tudatos lépés, amely során belsőleg átfogó eljárást készít elő.
Ennek a megközelítésnek az előnye a pontosabb tervezés, a logikai hibák csökkentése és a többszintű feladatok jobb megértésének képessége. Ez a változás a régebbi modellekhez képest azonnal megmutatkozik. A felhasználó észreveszi, hogy a modell nem reagál olyan gyorsan, hanem időt szán a válasz átgondolására.
További újdonság a továbbfejlesztett multimodalitás. A Gemini 3 minden médiatípust képes kezelni, ezzel követve a trendet, hiszen a mai tartalom már nem csak szöveges. A készítők ráadásul javították a képgenerálást az Imagen 3 technológia integrálásával, amely a hivatalos bemutatók szerint sokkal realisztikusabb eredményeket kínál, mint a régebbi verziók, és jobban tartja magát a feladathoz.
Az új generáció előnyének kell lennie a hosszabb kontextus megtartásának képessége is, ami az egyik legnagyobb előnye a konkurens ChatGPT 5.1 friss verziójának. A pontos korlátok még nem ismertek, de a prezentációkból kiderül, hogy a Gemini 3 kiterjedtebb dokumentumokkal tud dolgozni, mint elődje. Ez főleg szakmai szövegek, jogi elemzések vagy akadémiai anyagok esetében fontos, ahol a felhasználónak hosszabb forrásokkal kell dolgoznia. Ha például tananyagokon vagy cikken dolgozol, az új modell hasznosabb lesz számodra.
A Gemini 3 három fő felhasználói csoportot céloz meg. Az első a szakemberek, akiknek hosszabb dokumentumokkal vagy összetett multimodális tartalommal kell dolgozniuk. A Google számukra API-t (interfészt) kínál, ahol tesztelhetik a modellt, és integrálhatják saját eszközeikbe.
A második csoport a fejlesztők, akik számára a Gemini 3 Pro az API-ban elérhető a bevezetés óta. A fejlesztők így kihasználhatják képességeit harmadik féltől származó alkalmazásokban, ebben a térben pedig nagy mennyiségű olyan eszköz születik, amely szöveg, kép és hang kombinációján alapul.
A harmadik csoportot az átlagfelhasználók alkotják. Ők a Gemini alkalmazáson keresztül férhetnek hozzá. A Gemini 3 fokozatosan terjed az interfészbe és a felhasználó a Thinking mód kiválasztásával aktiválhatja. A Google az Android rendszerbe való integrációt tervezi, de ez egyelőre csak az alkalmazás szintjén zajlik. A mélységi integráció közvetlenül a rendszerben a telefonok gyártóinak frissítéseitől függ.
Az újdonság gyors elérhetőségét azonban korlátok kísérik. A Thinking mód számításigényes, ezért a gyártó korlátozza a napi lekérdezések számát. Az ingyenes verzió csak kisebb mennyiségű ilyen választ kínál (nagyságrendileg tízes nagyságrendben vagy kevesebb lekérdezés). A Google One AI Premium előfizetéssel rendelkező felhasználók korlátai jelentősen magasabbak, de az ő esetükben sem korlátlanok. A korlát kimerülése után az alkalmazás gyorsabb, de kevésbé igényes változatot kínál.
A Gemini 3 használata az ingyenes Gemini alkalmazás verzióban is lehetséges, de magasabb korlátokhoz és a Thinking módhoz való hozzáféréshez előfizetésre lesz szükséged. Ennek az előfizetésnek része a két terabájtos tárhely is a Google Drive-on, tehát nemcsak az AI funkciók áráról van szó. Ez azonban nem újdonság, ez így volt már az előző modelleknél is.
A cégek számára API áll rendelkezésre a Google Cloud szolgáltatás keretében. Az ár a feldolgozott tokenek számából és a cég által választott modellváltozatból származik. A Google különböző árszinteket és egyedi ajánlatokat biztosít. Ugyanezek a feltételek érvényesek az egész Európai Unióra, tehát a magyar cégek ugyanazokhoz az árakhoz férnek hozzá, mint a többi európai vállalkozás.
i
Ezek a cikkek is érdekelhetnek:
A Gemini 3 a Google legújabb modellje, amely új módot sajátít el az információkkal való munkához és lényegesen mélyebben gondolkodik, mint elődjei. Már elérhető a Gemini alkalmazásban Magyarországon is, továbbá 2025. november 18-tól minden felhasználó kipróbálhatja Android telefonnal vagy iPhone-nal is. Az újdonság multimodalitást, továbbfejlesztett képgenerálást és főleg új gondolkodásmódot kínál, amely lassabb, de átgondoltabb válaszokban nyilvánul meg. A Gemini 3 fejlesztése a következő hónapokban is folytatódik, mivel a Google tervezi annak integrálását ökoszisztémája további részeibe.