Tanulmány: Az LM Arena manipulálja a mesterséges intelligencia teszteket

Vádat emeltek az LM Arena ellen az AI tesztelés manipulálása miatt

Transzparencia és Verseny a Mesterséges Intelligenciában: Az LM Arena és a Nagyvállalatok Kapcsolata

A mesterséges intelligencia (MI) világa folyamatosan bővül, de vele együtt új kihívások is megjelennek. Az AI lab Cohere, a Stanford Egyetem, a MIT és az Ai2 frissen megjelent tanulmánya fényt derített arra, hogy az LM Arena, a népszerű AI mérési platform, favoritizálta a nagyobb cégeket, ezzel hátrányos helyzetbe hozva kisebb versenytársaikat.

Mi Történt Valójában?

A kutatás fő állítása, hogy az LM Arena lehetőséget biztosított olyan iparági vezetőknek, mint a Meta, OpenAI, Google és Amazon, hogy különböző MI modellek változatait titkos tesztelés során mérjék össze. Ezen tesztek legrosszabb teljesítményét pedig nem tették közzé, ami lehetővé tette, hogy ezek a cégek a platform rangsorának élére kerüljenek, míg más, kisebb cégek nem kaptak hasonló lehetőséget.

Sara Hooker, a Cohere AI kutatásért felelős alelnöke, a TechCrunchnak nyilatkozva kiemelte, hogy „csupán néhány cég tájékoztatást kapott arról, hogy elérhető ez a titkos tesztelési lehetőség”, és hogy ez „játékosítást” jelent a rangsorokban.

A Chatbot Arena Mint Referenciapont

A Chatbot Arena 2023-ban kezdődött, mint egy akadémiai kutatási projekt a Berkeley Egyetem részéről. A platform arra épít, hogy két különböző MI modell válaszait egymás mellé állítja, majd a felhasználók kiválasztják a jobbat. A szavazatok hozzájárulnak a modellek pontszámához, ami befolyásolja a rangsorolásukat.

Bár az LM Arena eddig azt állította, hogy a rendszerük pártatlan, a kutatók most 2,8 millió csatát vizsgálva azt állítják, hogy a nagy cégek előnyhöz jutottak azáltal, hogy több adatot gyűjthettek a platformon, így a tesztelés során jelentősebb tapasztalatokat szereztek.

Válaszok és Visszajelzések

Az LM Arena egyik alapítója, Ion Stoica, az a nyilatkozatában az állította, hogy a tanulmány tartalmaz „pontatlanságokat” és „kérdéses elemzéseket”. A szervezet hangsúlyozta, hogy elkötelezettek a közösség által vezérelt értékelések iránt, és bátorítják a modellkínálókat, hogy több modellt nyújtsanak be.

A kutatás szerzői azonban azt állítják, hogy a módszerek, amelyeket az LM Arena használ, lehetővé tették, hogy bizonyos cégek, például a Meta, saját előnyükre alakítsák a rendszert. Az egyik kitétel szerint a cégek korlátozások nélküli hozzáféréssel tesztelhettek, míg mások hátrányos helyzetbe kerültek.

A Jövő Kilátásai

A kutatás eredményei arra hívják fel a figyelmet, hogy az LM Arena-nak szüksége van arra, hogy nagyobb átláthatóságot biztosítson a tesztelési folyamataiban. A kutatók javaslatokat tettek arra, hogy a tesztek számát korlátozzák, és a tesztek eredményeit nyilvánosságra hozzák. Az ilyen átláthatóság segíthet a verseny tisztaságának megőrzésében az MI területén.

Összességében az AI fejlődése új etikai és versenyjogi kérdéseket vet fel, amelyek kezelésére nagyobb figyelmet kell fordítani a jövőbeni fejlesztések során. A szakma által elvárt transzparencián kívül fontos, hogy minden szereplő egyenlő esélyekkel indulhasson a mesterséges intelligencia világszínpadán.

Szólj hozzá

Tetejére