A Meta bemutatja a Llama 4 AI modelleket

A Meta bemutatja a Llama 4 AI modelleket

**Új korszak köszöntött be a mesterséges intelligencia világában: bemutatkozik a Meta Llama 4**

A hétvége méltó esemény volt a technológia rajongói számára, hiszen a Meta bejelentette új mesterséges intelligencia modelljei, a Llama 4 család legújabb tagjait. Ez a négy modell – a Llama 4 Scout, Llama 4 Maverick és Llama 4 Behemoth – olyan áttörő fejlesztéseket ígér, amelyek képesek fenekestül felforgatni az AI alkalmazások eddigi világát. A Meta állítása szerint ezek a modellek rendkívül széleskörű vizuális megértéssel bírnak, mivel hatalmas mennyiségű címke nélküli szöveg-, kép- és videóadatot használtak fel a képzésük során.

### A konkurencia hajtóereje

A Meta fejlesztései mögött a DeepSeek, egy kínai AI laboratórium nyitott modelljeinek sikere áll. A DeepSeek által észlelt, a Meta korábbi Llama modelljeivel azonos, vagy akár jobb teljesítményt nyújtó megoldások komoly versenykényszer alá helyezték a Metát. Állítólag a Meta külön „háborús” irodákat alakított ki, hogy feltérképezze, hogyan tudja a DeepSeek olyan alacsonyan tartani a modelljeik üzemeltetési költségeit.

### Nyílt hozzáférés, de szigorú szabályok

Jó hír, hogy a Scout és a Maverick modellek nyíltan elérhetők a Llama.com oldalon, valamint a Meta partnereinél, például a Hugging Face AI fejlesztői platformon. Eközben a Behemoth modell még mindig a tanulási fázisában van. Érdekesség, hogy a Meta AI, amely az alkalmazásokban, például a WhatsApp, Messenger és Instagram területén működik, frissítést kapott, így már 40 országban használja a Llama 4-et. A multimodális funkciók azonban jelenleg csak az Egyesült Államokban érhetők el, angol nyelven.

Fontos megemlíteni, hogy a Llama 4 licencével kapcsolatban némi aggodalomra adhat okot, hogy az Európai Unióban bejegyzett felhasználók és cégek nem használhatják vagy terjeszthetik a modelleket. A háttérben az EU szigorú AI- és adatvédelmi szabályozásai állnak, amelyek könnyen magyarázzák ezt a tilalmat.

### Az új modellek titkai

A Llama 4 család első modelljei a híres „mixture of experts” (MoE) architektúrán alapulnak, amely kifejezetten a számítási hatékonyság növelésére lett kifejlesztve. Ez gyakorlatilag azt jelenti, hogy a nagy adatfeldolgozási feladatokat kisebb, specializált „szakértő” modellekre bontják. Például a Maverick 400 milliárd paraméterrel bír, de csak 17 milliárd aktív paraméter fut 128 szakértő között. A Scout ezzel szemben 17 milliárd aktív paramétert és 16 szakértőt használ, összesen 109 milliárd paraméterrel.

### Kik az úttörők?

A Meta belső tesztjei alapján a Maverick, amely a „általános asszisztens és chat” felhasználásokra lett optimalizálva, bizonyos kódolási és többnyelvűséghez kapcsolódó feladatokban kiemelkedő teljesítményt mutat. A kifejlesztett modellek nem csak a szöveggel, hanem képekkel is képesek dolgozni, így a Scout óriási előnye, hogy 10 millió tokent, azaz szót vagy szövegrészletet fogadhat be egyszerre.

Miközben a Meta folyamatosan próbálja csökkenteni a modellek válaszadási idejét, a tervezők külön figyelmet fordítottak arra, hogy a Llama 4 modellek válaszaikban kiegyensúlyozottabbak legyenek. A Meta képviselője hangsúlyozta, hogy a cél olyan hasznos, tényeken alapuló válaszokat adni, amelyek nem favorizálnak semmilyen politikai nézőpontot.

### Következtetés

Ahogy a Meta írta, a Llama 4 modellek bevezetése egy új korszakot jelent a mesterséges intelligencia ökoszisztémájában. Ezek az újdonságok számos lehetőséget kínálnak a fejlesztők és a felhasználók számára. Bár a Llama 4 modellek számos kihívással néznek szembe, a fejlődés irányát és az izgalmakat egyértelműen fokozza az AI világának folyamatos változása.

Szólj hozzá

Tetejére