Új AI Modellek: A Microsoft Bemutatja a Phi 4 Családot
2025 áprilisában a Microsoft jelentős újításokat mutatott be AI területén, hiszen néhány új “nyílt” AI modellt indított el. Ezek közül a legfejlettebb modell, a Phi 4 reasoning plus, már versenyre kelhet az OpenAI o3-mini modelljével bizonyos teszteken.
A Modellcsalád Áttekintése
A Microsoft új modelljei – a Phi 4 mini reasoning, Phi 4 reasoning és Phi 4 reasoning plus – a „gondolkodó” modellek kategóriájába tartoznak. Ezek a modellek képesek alaposabban ellenőrizni a bonyolult problémákra adott megoldásokat. Ezzel a lépéssel a Microsoft bővíti a Phi „kis modell” családját, amelyet egy évvel ezelőtt indítottak el, hogy alapot biztosítsanak az AI fejlesztők számára. Az új modellek célja, hogy segítenek az alkalmazások hatékonyabb működtetésében, különösen az erőforrás-korlátozott eszközökön.
Phi 4 Mini Reasoning: Oktatásra Szabva
A Phi 4 mini reasoning modell közel 1 millió szintetikus matematikai feladaton lett kiképezve, amelyeket a kínai DeepSeek vállalat R1 modellje generált. A modell mérete körülbelül 3,8 milliárd paraméter, és a Microsoft szerint kifejezetten az „önálló tutorálásra” alkalmas könnyű eszközökön. A paraméterek szám növekedésével a modellek problémamegoldó képessége is javul, azaz a nagyobb paraméterekkel rendelkező modellek általában jobb teljesítményt nyújtanak.
Példák a Fejlettebb Modellekre
A Phi 4 reasoning, amely 14 milliárd paraméterrel rendelkezik, „magas minőségű” webes adatok és a korábban említett o3-mini modellből származó demonstrációk felhasználásával lett kiképezve. Ez a modell különösen jól teljesít matematikai, tudományos és programozási alkalmazásokban.
A Phi 4 reasoning plus a már korábban megjelent Phi 4 modell újragondolt verziója, amely új „gondolkodó” funkciókkal rendelkezik. Ez a verzió a DeepSeek R1 modell teljesítményéhez közelít, amelynek sokkal több, 671 milliárd paramétere van. A Microsoft belső tesztjei szerint a Phi 4 reasoning plus teljesítménye az o3-mini teljesítményével is összehasonlítható a matematika területén végzett OmniMath teszt során.
Az Újdonságok Hátterében
A Microsoft a modellek fejlesztése során distillációt, megerősítő tanulást és magas minőségű adatokat használt. A vállalat hangsúlyozza, hogy ezek az új modellek megfelelő egyensúlyt teremtettek a méret és a teljesítmény között. Kicsi méretük lehetővé teszi, hogy alacsony késleltetésű környezetekben is hatékonyan működjenek, miközben megőrzik erős gondolkodási képességeiket, így a kisebb erőforrású eszközök is képesek bonyolult logikai feladatok ellátására.
Összegzés
A Microsoft új AI modellei nem csupán technológiai újdonságot jelentenek, hanem az alkalmazások fejlődését is elősegítik, különösen az oktatás és más kritikus területeken. A Phi család legújabb tagjai lehetőséget adnak a fejlesztőknek, hogy egyre kifinomultabb alkalmazásokat hozzanak létre, így hozzájárulva a mesterséges intelligencia jövőjének alakításához.