Az OpenAI bejelentette legújabb o3 mini modelljének és a nagyobb teljesítményű o3 mini high változatának bevezetését. Az új modell jelentős fejlesztéseket hoz magával a programozási, matematikai és logikai feladatokban, ráadásul ingyenesen elérhető a ChatGPT-n. A fizetős verziók nagyobb számítási kapacitáshoz biztosítanak hozzáférést, az ingyenesnek pedig vannak bizonyos korlátai. Melyek a modell főbb újdonságai, és hogyan viszonyul az olyan versenytársakhoz, mint a DeepSeek R1 és a Claude 3.5 Sonnet?
Az OpenAI jelentése szerint az o3 mini gyorsabb válaszokat ad, mint elődje, az o1 mini, miközben nagyobb pontosságot ér el. A modellt úgy tervezték, hogy kiemelkedő teljesítményt nyújtson a lépésenkénti érvelést igénylő feladatokban, amelyek közé például az összetett matematikai problémák és a programkódok elemzése tartozik. Emellett ún. „érvelési láncot“ is tartalmaz, ami azt jelenti, hogy a modell válaszadáskor tükrözi saját érvelését, és világosan meg tudja magyarázni a megközelítését.
Az elv az, hogy a modell először kisebb lépésekre bontja a problémát, minden egyes részt külön-külön elemez, belső számításokat végez, majd e szekvenciális elemzés alapján felépíti a végső választ. Ez lehetővé teszi, hogy jobban megértsük, hogyan jutott a mesterséges intelligencia a következtetésre, miközben növeli a válaszok pontosságát és következetességét.
Az OpenAI benchmark tesztjei szerint az o3 mini modell akár 24%-kal gyorsabban válaszol, mint az o1 mini, és számos feladatban nagyobb pontosságot ér el. A fizetős verziók között elérhető az o3 mini high is, amely komplex programozási és logikai feladatokra van optimalizálva.
A gyakorlatban ez a javulás például az összetett matematikai feladatok megoldásakor jelentkezik, ahol a modell most már hatékonyabban képes a problémákat lépésekre bontani, és kiküszöbölni a közbenső számítási hibákat. A felhasználók a kódgenerálás nagyobb pontosságát is értékelni fogják, ami kevesebb szükséges korrekciót és hibakeresést jelent. A ChatGPT normál használata során az o3 mini gyorsabbnak bizonyul az összetett kérdésekre adott összefoglaló válaszok, például tudományos magyarázatok vagy különböző témák részletes elemzése során is.
Az O3 mini high bizonyítottan a legerősebb modell napjainkban a kódoláshoz. A LiveBench szerint 82,74-es eredményt ér el, jelentősen felülmúlva a DeepSeek R1 (66,74), a Claude 3.5 Sonnet(67,13) és a régebbi OpenAI o1 (69,69) modellek teljesítményét. Más platformokon és benchmarkokon is kiemelkedő eredményeket ér el a modell, ezzel a világ legjobb kódolói közé tartozik.
| Modell | Teljes átlag | Logikai gondolkodás | Kód létrehozása | Matematika | Adatelemzés | Nyelv | Utasítások betartása |
|---|---|---|---|---|---|---|---|
|
o3 mini high
(31.1.2025) OpenAI |
75.88 ✓ | 89.58 | 82.74 ✓ | 77.29 | 70.64 ✓ | 50.68 | 84.36 |
|
o1 high
(17.12.2024) OpenAI |
75.67 | 91.58 ✓ | 69.69 | 80.32 | 65.47 | 65.39 ✓ | 81.55 |
| Deepseek R1 | 71.57 | 83.17 | 66.74 | 80.71 ✓ | 69.78 | 48.53 | 80.51 |
|
o3 mini
(31.1.2025 medium) OpenAI |
70.01 | 86.33 | 65.38 | 72.37 | 66.56 | 46.26 | 83.16 |
|
Gemini 2.0 Flash
(thinking exp 01-21) |
66.92 | 78.17 | 53.49 | 75.85 | 69.37 | 42.18 | 82.47 |
|
Gemini 2.0 Pro
(exp 02-05) |
65.13 | 60.08 | 63.49 | 70.97 | 68.02 | 44.85 | 83.38 |
|
Gemini
(exp 1206) |
64.09 | 57.00 | 63.41 | 72.36 | 63.16 | 51.29 | 77.34 |
|
o3 mini
(31.01.2025 low) OpenAI |
62.45 | 69.83 | 61.46 | 63.06 | 62.04 | 38.25 | 80.06 |
|
Gemini
2.0 flash |
61.47 | 55.25 | 53.92 | 65.62 | 67.55 | 40.69 | 85.79 ✓ |
| Deepseek v3 DeepSeek |
60.45 | 56.75 | 61.77 | 60.54 | 60.94 | 47.48 | 75.25 |
|
Gemini 2.0 flash
(exp) |
59.26 | 59.08 | 54.36 | 60.39 | 61.67 | 38.22 | 81.86 |
|
Claude 3.5 Sonnet
(22.10.2024) Anthropic |
59.03 | 56.67 | 67.13 | 52.28 | 55.03 | 53.76 | 69.30 |
|
ChatGPT 4o
(29.1.2025) OpenAI |
57.79 | 57.92 | 60.56 | 48.02 | 66.00 | 49.14 | 65.07 |
Az o3 mini és o3 mini high összehasonlítása olyan modellekkel, mint a Gemini, DeepSeek és Claude. Forrás: LiveBench.
Bár az innováció rendkívül hatékony a programozási és matematikai feladatokban, használata nem korlátozódik a műszaki területekre. Az O3 mini az átlag felhasználók számára is alkalmas, akik gyors és pontos válaszokat keresnek mindennapi kérdésekre, legyen szó akár tervezésről, oktatásról vagy általános ismeretekről. Ha például karrierrel, pénzügyekkel vagy személyes fejlődéssel kapcsolatos tanácsot keresnek, a modell világos és strukturált, könnyen érthető válaszokat ad.
Emellett az összetett szövegek elemzésére és világos összefoglalók készítésére való képesség teszi az o3 minit nagyszerű eszközzé a diákok számára, akiknek bonyolult témák gyors megértésére vagy segítségre van szükségük a szövegek megírásához.
A kínai DeepSeek R1-gyel való közvetlen összehasonlítás, amelyet nemrégiben indítottak el ingyenes modellként, és amely az érvelésre helyezi a hangsúlyt, alapvető különbséget mutat a válaszok megközelítésében. Míg az o3 mini tömörebb és világosabban strukturált válaszokat ad, betekintést nyújtva a logikájába, addig a DeepSeek R1 kiterjedtebb érvelési folyamatot kínál, amelyben felfedi a felhasználónak a kételyeit és az alternatív megközelítési lehetőségeket.
Amikor például azt kérdezik, hogy jobb-e egyetemre menni vagy egyenesen munkába állni, az o3 mini először értékeli az olyan tényezőket, mint az érdeklődési kör, az anyagi helyzet és a jövőbeli munkaerőpiac, majd összefoglaló elemzést ad. Ezzel szemben a DeepSeek R1 részletesebben kidolgozza a gondolatmenetet, gyakrabban vesz figyelembe több hipotetikus forgatókönyvet és lehetséges, egymásnak ellentmondó érveket.
A független teszteredmények azt mutatják, hogy az o3 mini világosabb és közvetlenebb válaszokat ad, átlátható magyarázatot adva a folyamatról, míg a DeepSeek R1 inkább a tágabb összefüggésekre, a lehetséges árnyalatokra és a döntéshozatali folyamat nyitottabb elemzésére összpontosít.
Az O3 mini most először a nem fizetős ChatGPT felhasználók számára is elérhető. Az ingyenes verzióban a chatben a „Gondolkodj” gombbal aktiválható. A Plus és Team felhasználók napi 150 üzenetre vannak korlátozva, míg a Pro előfizetők korlátlan hozzáférést kapnak az o3 mini és o3 mini high szolgáltatáshoz.
| Szolgáltató | Csomag | Ár | Főbb jellemzők |
|---|---|---|---|
| OpenAI | FREE | 0 USD | Ingyenes GPT-4o mini, továbbá korlátozott hozzáférés a GPT-4o és o3-mini verziókhoz, valamint a fájlfeltöltés, adatelemzés, képgenerálás és hangmód funkciókhoz. |
| ChatGPT Plus | 20 USD | Minden az ingyenes verzióból, hozzáférés az o1 és az o3-mini programhoz. Magasabb korlátok az analitikára, a jelentésekre, a fájlfeltöltésre, a képgenerálásra és a hangmódra. | |
| ChatGPT Pro | 200 USD | Haladó felhasználóknak tervezték - szinte korlátlan hozzáférés, nagyobb számítási teljesítmény, fejlett hangmód stb. | |
| Google (Gemini) | Gemini Standard | Ingyenes | Hozzáférés a Gemini 2.0 Flash és Flash Thinking Experimental alapmodellekhez, valamint a többi Google alkalmazáshoz való kapcsolódás lehetősége. |
| Gemini Advanced / Google One AI Premium | ~20 USD | Teljes verzió (Gemini 2.0 Pro) kibővített kontextusablakkal (akár 1 millió token), elsőbbségi hozzáféréssel az új funkciókhoz, integrációval a Google Workspace-be és 2 TB felhőalapú tárolóval. | |
| Anthropic (Claude) | Claude Free | Ingyenes | Alapszintű hozzáférés a Claude-hoz, korlátozott számú üzenettel naponta (kb. 30-50 üzenet/nap), kezdők számára alkalmas. |
| Claude Pro | 20 USD | Magasabb limitek, hozzáférés a fejlettebb modellekhez (pl. Claude 3 Opus), elsőbbségi hozzáférés az új termékekhez. | |
| DeepSeek | DeepSeek (R1) | Ingyenes | Ingyenes, személyes használatra alkalmas, időnként stabilitási problémák (szervertúlterhelés). |
i
A 2025. februári állapot szerint, a funkciók és modellek rendszeresen változnak. Az egyértelműség kedvéért csak az alapárat tüntettük fel rendszeres havi törlesztéssel. Alacsonyabb árat kaphatsz, ha az éves előfizetést választod. Ugyanakkor listánk nem tartalmazza a vállalati csomagokat.
Az árképzési csomagokkal kapcsolatos aktuális információkért lásd: Google Gemini, OpenAI ChatGPT, Anthropic Claude.
Az ingyenes verzió azonban további korlátozásokkal rendelkezik a fizetős verzióhoz képest. Például az erősebb o3 mini high-hoz való hozzáférés kizárólag a fizetős felhasználók számára biztosított. Továbbá az elérhető funkciók, a válaszkésleltetés és a szerver prioritása változhat, ami azt jelenti, hogy az ingyenes felhasználók időnként lassabb válaszidőt tapasztalhatnak.
A modell az OpenAI API-ban is elérhető, és integrálható a Microsoft Azure OpenAI Service, a GitHub Copilot és más Microsoft-eszközökbe.
Az o3 mini bevezetése jelentős előrelépést jelent a logikai gondolkodás és a kódolás modelljei terén. A gyors válaszokkal, a fejlett logikai gondolkodással és a programozási feladatok pontosságával ez a kategória legerősebb modellje.
i
Ezek a cikkek is érdekelhetnek:
Ezen túlmenően az ingyenes változat elérhetősége lehetővé teszi, hogy a felhasználók széles köre kihasználhassa a műszaki területeken túlmutató képességeit. Míg a DeepSeek-R1 formájában a versenytársak szélesebb körű válaszokat kínálnak, az o3 mini ehelyett strukturáltabb és átláthatóbb képet nyújt saját érvelési folyamatáról. A ChatGPT-ben szabadon elérhető verzióval mindenkinek lehetősége nyílt arra, hogy saját maga tesztelje a modell képességeit.