Új AI Modellek az OpenAI-tól: o3 és o4-mini
Az OpenAI szerdán bejelentette legújabb AI modelleinek érkezését, az o3 és o4-mini-t, amelyek célja, hogy magasabb szintű gondolkodási képességekkel rendelkezzenek. De miért éppen most indítanak új modelleket, és mit is tudnak ezek az innovációk? Merüljünk el a részletekben!
Kiemelkedő teljesítmény és versenyelőny
Az o3 modellt az OpenAI eddigi legfejlettebb érvelő rendszerének nevezi. Az eddigi tesztek során olyan területeken mutatott kiemelkedő teljesítményt, mint a matematikai problémák, a programozás, a tudományos kérdések, valamint a vizuális feldolgozási képességek. Az o4-mini ezzel szemben a költségek, a sebesség és a teljesítmény közötti kiegyensúlyozott kompromisszumnak számít. Ez a három szempont kulcsfontosságú, amikor a fejlesztők mesterséges intelligencia modellt választanak alkalmazásaikhoz.
Új funkciók az interaktív élményért
A legújabb modellek, a sokkal fejlettebb o3 és az o4-mini, már képesek válaszokat generálni különféle eszközök felhasználásával, mint például a webes keresés, a Python kód futtatása és még a képek feldolgozása is. A ChatGPT felhasználói már ma hozzáférhetnek ezekhez a modellekhez, beleértve az o4-mini-high változatot is, amely a válaszok kidolgozására több időt szán a megbízhatóság növelése érdekében.
Ez a lépés nyilvánvalóan része annak a versenyképességi stratégiának, amellyel az OpenAI próbálja meghódítani a mesterséges intelligencia piacát. Versenytársai, mint például a Google, a Meta, és más cégek sem tétlenkednek, folyamatosan fejlesztve saját AI megoldásaikat.
Gondolkodás képekben?
Az OpenAI állítása szerint az o3 és o4-mini modellek az első olyan rendszerek, amelyek képesek „gondolkodni képekben”. A gyakorlatban ez azt jelenti, hogy a felhasználók képeket, például fehér táblás vázlatokat vagy PDF-diagramokat tölthetnek fel, amelyeket a modellek elemeznek a válaszadás előtt. Ez az új képesség lehetővé teszi, hogy az o3 és o4-mini modellek megértsék a homályos vagy alacsony felbontású képeket, sőt akár a zoomolásra vagy forgatásra is képesek.
A jövő a fejlesztők kezében
Az o3, o4-mini, és az o4-mini-high modellek nemcsak a ChatGPT-n keresztül érhetők el, hanem az OpenAI fejlesztői API-ján is, így a mérnökök a cég modelljeivel építhetnek alkalmazásokat. Az OpenAI viszonylag alacsony áron kínálja az új modellek használatát, mindezt figyelembe véve a kiemelkedő teljesítményüket.
Az OpenAI, többek között, 10 dollárt kér a fejlesztőktől egymillió bemeneti tokenért az o3-ért, míg az o4-miniért az árszabás hasonló marad. A jövő héten várhatóan az o3-pro is megjelenik, amely még magasabb számítási teljesítményt kínál a ChatGPT Pro előfizetők számára.
Sam Altman, az OpenAI vezérigazgatója jelezte, hogy az o3 és o4-mini lehet az utolsó önálló érvelő modellek a ChatGPT-ben, mielőtt megérkezik a GPT-5, amely újraegyesíti a korábbi számítási modelleket a legújabb érvelési technológiákkal.