Google Bemutatta Az Új Gemini 2.5 AI Modellek Családját
Második alkalommal is felszínre került a mesterséges intelligencia (AI) világában a Google, hiszen kedden bejelentették a Gemini 2.5-öt. Ez az új család „gondolkodó” AI modelleket tartalmaz, amelyek válaszadás előtt szünetet tartanak, hogy alaposabban megfontolják a kérdést. Az indulásra érkezett Gemini 2.5 Pro Experimental azt ígéri, hogy a cég eddigi legintelligensebb modellje, amely multimodális képességeivel sok területet meghódíthat.
A Gemini 2.5 Pro Érkezése
A Gemini 2.5 Pro már elérhető a Google AI Studio fejlesztői platformon, valamint a Gemini alkalmazásban, ami havi 20 dolláros előfizetéssel rendelkező felhasználóknak is kínálja ezt az új funkciót. A Google bejelentette, hogy minden új AI modellje a jövőben beépített érvelési lehetőségekkel rendelkezik, ezáltal komoly lépéseket tesznek a mesterséges intelligencia fejlesztése terén.
Verseny az AI Érvelési Modellekért
Az OpenAI 2024 szeptemberében indította el az első AI érvelési modellt, az o1-et, ami óriási változást indított el a technológiai piacon. A rivális cégek, mint az Anthropic, DeepSeek, Google és xAI most versenybe szálltak, hogy felülmúlják ezt a modellt. Az AI érvelési modellek az extra számítási teljesítmény és idő használatával képesek valóságbeli összevetésekre és problémamegoldásokra, mielőtt választ adnak.
Teljesítmény és Eredmények
Az AI érvelési technikák forradalmasították a mesterséges intelligencia teljesítményét matematikai és programozási feladatokban. A szakértők szerint ezek a modellek kulcsfontosságú szerepet játszanak az autonóm rendszerek, azaz az emberi beavatkozás nélkül működő AI ügynökök jövőjében. Azonban nem titok, hogy ezek a modellek költségesebbek is.
A Google már korábban is végzett kísérleteket az AI érvelési modellekkel, hiszen tavaly decemberben bemutatták a Gemini egy „gondolkodó” verzióját. Azonban a Gemini 2.5 olyan újítást hoz, amely a Google eddigi legkomolyabb próbálkozását jelenti, hogy túlszárnyalja az OpenAI „o” sorozatát. A cég állítása szerint a Gemini 2.5 Pro teljesítménye felülmúlja előző AI modelljeit és a versenytársak legjobbjait is, számos benchmark tesztben.
Fontos Teszt Eredmények
A kód szerkesztését mérő Aider Polyglot teszten a Gemini 2.5 Pro 68.6%-os eredményt ért el, így felülmúlta az OpenAI, Anthropic és a DeepSeek vezető AI modelljeit is. Ugyanakkor a SWE-bench Verified nevű szoftverfejlesztési teszten a Gemini 2.5 Pro 63.8%-ot teljesített, ami már nem olyan kiemelkedő, mint az Anthropic Claude 3.7 Sonnet 70.3%-os eredménye.
A Humanity’s Last Exam elnevezésű, multimodális teszten, amely több ezer tömeges kérdést tartalmazott matematikai, humán és természettudományos területeken, a Gemini 2.5 Pro 18.8% teljesítményt nyújtott, így jobb eredményt ért el, mint a legtöbb versenytársa.
Új Funkciók és Lehetőségek
Az új Gemini 2.5 Pro képességei között kiemelkedik, hogy egy millió tokenes kontextusablakkal indul, amely lehetővé teszi, hogy körülbelül 750,000 szót dolgozzon fel egy lépésben. Ez hosszabb, mint a „Gyűrűk Ura” teljes könyvsorozata. A közeljövőben 2 millió token támogatására is képes lesz, ami még tovább növeli a képességeit.
Jelenleg a Google nem jelentette be a Gemini 2.5 Pro API árazását, de ígéri, hogy a következő hetekben további információkkal szolgál.
Maxwell Zeff, a TechCrunch vezető riportere, aki az AI és a feltörekvő technológiákra specializálódott, San Franciscóból tudósít. Amikor éppen nem dolgozik, a Bay Area természeti szépségeit fedezi fel, vagy a helyi gasztronómiai élvezeteknek hódol.