Megérkezett a Gemini 3. Mit tud az új Thinking mód?

Aktualizálva: 2025. november 20. • Szerző: Peter Vnuk

A Google bemutatta a Gemini 3-at, mint a mesterséges intelligencia fejlesztésének újabb lépcsőfokát, amely már nemcsak egy elméleti modell a blogon, hanem egy általánosan elérhető eszköz. A felhasználóknak lehetőségük van átváltani a Gemini alkalmazásban az új modellre és kipróbálni annak gondolkodását a gyakorlatban.

Google Gemini 3, bevezető

Google Gemini 3 – TARTALOM

Mi a Gemini 3 és hogyan illeszkedik a Google AI fejlesztésébe?
Újdonságok és a Gemini 3 fő képességei
Kiknek szól a Gemini 3?
Gemini 3 előfizetés

Mi a Gemini 3 és hogyan illeszkedik a Google AI fejlesztésébe?

A Google hivatalos blogja a Gemini 3-at olyan modellként mutatja be, amelynek fokozatosan meg fog jelenni a vállalat legtöbb szolgáltatásában. Tehát nagy valószínűséggel számíthatunk rá az olyan alkalmazásokban, mint a Google Drive, Dokumentumok és Gmail.

Az előző generáció közvetlen utódja, de azzal a különbséggel, hogy már nemcsak a szöveggenerálás teljesítményére összpontosít. Ehelyett arra fókuszál, hogy a modell jobban gondolkodjon, tervezzen és megértse a komplex feladatokat szélesebb összefüggésekben. Nem csoda, hiszen a konkurencia is ebbe az irányba halad, és a technológiai óriás nem engedheti meg magának, hogy lemaradjon.

A cég már régóta egy egységes architektúra felé halad, amely a keresést (nemrég jelent meg benne az AI mód), a Gemini alkalmazást és a dokumentumkezelő eszközöket hivatott hajtani. Éppen a Gemini 3-nak kell betöltenie ezt a szerepet. Úgy tervezték, hogy natívan kezelje a szöveget, képet, hangot és videót egy közös kontextusban. A felhasználónak így nem kell azon gondolkodnia, milyen típusú bemenetet használjon, mert a Gemini 3 egészként érti az információk struktúráját. Ráadásul az előző verziókhoz képest már nem kell különböző almodelleket használnia.

Gépi tanulás a gyakorlatban: hogyan tanulnak a számítógépek az adatokból, és mit jelent ez a mindennapokban?

Az új Gemini 3 modell már bemutatásra került, tehát nem olyan technológiáról van szó, amelyre várni kellene. Ennek ellenére még nem mondható, hogy mindenki teljes mértékben használja. Egyes funkciók elérhetősége még bővül, továbbá a teljes bevezetés a szolgáltatások között több hétig vagy hónapig is eltarthat.

Újdonságok és a Gemini 3 fő képességei

A fejlesztők a Gemini 3-nál hangsúlyozzák azt a módot, ahogyan a modell gondolkodik. Egy Thinking (Gondolkodás) nevű módot használ, amelyet a felhasználó pontosan ezzel a kifejezéssel talál meg a Gemini alkalmazásban mobilon és böngészőben egyaránt. Aktiválása után a modell a válasz előtt egy pillanatra megáll, és láthatóan gondolkodik. Ez egy tudatos lépés, amely során belsőleg átfogó eljárást készít elő.

Ennek a megközelítésnek az előnye a pontosabb tervezés, a logikai hibák csökkentése és a többszintű feladatok jobb megértésének képessége. Ez a változás a régebbi modellekhez képest azonnal megmutatkozik. A felhasználó észreveszi, hogy a modell nem reagál olyan gyorsan, hanem időt szán a válasz átgondolására.

További újdonság a továbbfejlesztett multimodalitás. A Gemini 3 minden médiatípust képes kezelni, ezzel követve a trendet, hiszen a mai tartalom már nem csak szöveges. A készítők ráadásul javították a képgenerálást az Imagen 3 technológia integrálásával, amely a hivatalos bemutatók szerint sokkal realisztikusabb eredményeket kínál, mint a régebbi verziók, és jobban tartja magát a feladathoz.

Az új generáció előnyének kell lennie a hosszabb kontextus megtartásának képessége is, ami az egyik legnagyobb előnye a konkurens ChatGPT 5.1 friss verziójának. A pontos korlátok még nem ismertek, de a prezentációkból kiderül, hogy a Gemini 3 kiterjedtebb dokumentumokkal tud dolgozni, mint elődje. Ez főleg szakmai szövegek, jogi elemzések vagy akadémiai anyagok esetében fontos, ahol a felhasználónak hosszabb forrásokkal kell dolgoznia. Ha például tananyagokon vagy cikken dolgozol, az új modell hasznosabb lesz számodra.

Kiknek szól a Gemini 3?

A Gemini 3 három fő felhasználói csoportot céloz meg. Az első a szakemberek, akiknek hosszabb dokumentumokkal vagy összetett multimodális tartalommal kell dolgozniuk. A Google számukra API-t (interfészt) kínál, ahol tesztelhetik a modellt, és integrálhatják saját eszközeikbe.

A második csoport a fejlesztők, akik számára a Gemini 3 Pro az API-ban elérhető a bevezetés óta. A fejlesztők így kihasználhatják képességeit harmadik féltől származó alkalmazásokban, ebben a térben pedig nagy mennyiségű olyan eszköz születik, amely szöveg, kép és hang kombinációján alapul.

AI a telefonokban, avagy hogyan is néz ki a mesterséges intelligencia egy modern okostelefonban?

A harmadik csoportot az átlagfelhasználók alkotják. Ők a Gemini alkalmazáson keresztül férhetnek hozzá. A Gemini 3 fokozatosan terjed az interfészbe és a felhasználó a Thinking mód kiválasztásával aktiválhatja. A Google az Android rendszerbe való integrációt tervezi, de ez egyelőre csak az alkalmazás szintjén zajlik. A mélységi integráció közvetlenül a rendszerben a telefonok gyártóinak frissítéseitől függ.

Az újdonság gyors elérhetőségét azonban korlátok kísérik. A Thinking mód számításigényes, ezért a gyártó korlátozza a napi lekérdezések számát. Az ingyenes verzió csak kisebb mennyiségű ilyen választ kínál (nagyságrendileg tízes nagyságrendben vagy kevesebb lekérdezés). A Google One AI Premium előfizetéssel rendelkező felhasználók korlátai jelentősen magasabbak, de az ő esetükben sem korlátlanok. A korlát kimerülése után az alkalmazás gyorsabb, de kevésbé igényes változatot kínál.

Gemini 3 előfizetés

A Gemini 3 használata az ingyenes Gemini alkalmazás verzióban is lehetséges, de magasabb korlátokhoz és a Thinking módhoz való hozzáféréshez előfizetésre lesz szükséged. Ennek az előfizetésnek része a két terabájtos tárhely is a Google Drive-on, tehát nemcsak az AI funkciók áráról van szó. Ez azonban nem újdonság, ez így volt már az előző modelleknél is.

A cégek számára API áll rendelkezésre a Google Cloud szolgáltatás keretében. Az ár a feldolgozott tokenek számából és a cég által választott modellváltozatból származik. A Google különböző árszinteket és egyedi ajánlatokat biztosít. Ugyanezek a feltételek érvényesek az egész Európai Unióra, tehát a magyar cégek ugyanazokhoz az árakhoz férnek hozzá, mint a többi európai vállalkozás.

Ezek a cikkek is érdekelhetnek:

A Gemini 3 a Google legújabb modellje, amely új módot sajátít el az információkkal való munkához és lényegesen mélyebben gondolkodik, mint elődjei. Már elérhető a Gemini alkalmazásban Magyarországon is, továbbá 2025. november 18-tól minden felhasználó kipróbálhatja Android telefonnal vagy iPhone-nal is. Az újdonság multimodalitást, továbbfejlesztett képgenerálást és főleg új gondolkodásmódot kínál, amely lassabb, de átgondoltabb válaszokban nyilvánul meg. A Gemini 3 fejlesztése a következő hónapokban is folytatódik, mivel a Google tervezi annak integrálását ökoszisztémája további részeibe.

AI, mesterséges intelligencia Okostelefonok