Az AI és a nagy nyelvi modellek (LLM), amelyek táplálják, rengeteg hasznos alkalmazásuk van, de minden ígéretük szerint nem túl megbízhatóak.
Senki sem tudja, mikor oldja meg ezt a problémát, ezért van értelme, hogy látjuk, hogy az induló vállalkozások lehetőséget találnak a vállalkozások számára, hogy megbizonyosodjanak arról, hogy az LLM-alapú alkalmazások, amelyeket a tervezett munkájáért fizetnek.
Londoni székhelyű indítás Kompozíció Úgy érzi, hogy előzetes kezdete van a probléma megoldásának megkísérlésében, annak egyedi modelljeinek köszönhetően, amelyek segíthetnek a vállalkozásoknak az LLM -ek által üzemeltetett alkalmazások pontosságának és minőségének felmérésében.
A cég hasonló ÜgynökFreeplay, Emberloopés Langsmithamelyek mindegyike azt állítja, hogy szilárd, LLM-alapú alternatívát kínál az emberi teszteléshez, az ellenőrző listákhoz és a meglévő megfigyelhetőségi eszközökhöz. De a Composo azt állítja, hogy ez más, mert mind a nem kódot, mind az API-t kínálja. Ez figyelemre méltó, mert ez kiszélesíti a potenciális piacát – nem kell fejlesztőnek lennie, hogy felhasználhassa, és a domain szakértők és vezetők maguk is értékelhetik az AI alkalmazásokat az következetlenség, a minőség és a pontosság szempontjából.
A gyakorlatban a Composo kombájn A kimenetre kiképzett jutalommodell, amelyet egy személy inkább egy olyan AI alkalmazásból látna, amelynek meghatározott kritériumkészlete van, amely az alkalmazásra jellemző, hogy olyan rendszert hozzon létre, amely alapvetően értékeli az alkalmazásból származó kimeneteket e kritériumok alapján. Például egy orvosi triage chatbotnak az ügyfél beállíthatja az egyéni iránymutatásokat a piros zászló tüneteinek ellenőrzésére, és a Composo gólt szerezhet, hogy az alkalmazás mennyire következetesen csinálja.
A cég nemrégiben elindította a nyilvános API -t A Composo igazításához az LLM alkalmazások bármilyen kritérium alapján történő értékelésére szolgáló modell.
Úgy tűnik, hogy a stratégia kissé működik: olyan nevekkel rendelkezik, mint az Accenture, a Palantir és a McKinsey az ügyfélkörében, és nemrégiben 2 millió dollárt gyűjtött elő a magok előtti finanszírozással. Az itt felvetett kis összeg nem ritka a mai vállalkozás klímájában történő induláshoz, de ez figyelemre méltó, mert ez végül is az AI földterület – az ilyen társaságok finanszírozása bőséges.
A Composo társalapítója és vezérigazgatója, Sebastian Fox szerint azonban a viszonylag alacsony szám azért van, mert a startup megközelítése nem különösebben tőkeigényes.
„Legalább az elkövetkező három évben nem várjuk el magunkat, hogy százmilliókat neveljünk, mert sok ember építi az alapítvány modelleit, és ezt nagyon hatékonyan csináljuk, és ez nem a mi USP -vel” – mondta Fox, a McKinsey volt tanácsadója. „Ehelyett minden reggel, ha felébredek és látok egy olyan hírdarabot, amely az Openai hatalmas előrelépést tett a modellekben, ez jó a vállalkozásom számára.”
A friss készpénzzel a Composo azt tervezi, hogy kibővíti mérnöki csapatát (a társalapító és a CTO Luke Markham, a Graphcore korábbi gépi tanulási mérnöke vezetésével), több ügyfelet szerez és támogatja a K + F erőfeszítéseit. „Ebben az évben a hangsúly sokkal inkább a technológia méretezésére irányul, amely most már megvan ezekben a vállalatokban” – mondta Fox.
Brit AI előzetes alap Twin Path Ventures vezette a vetőmagot, amelyből szintén részvétel volt JVH vállalkozások és Bebörtönzés (Ez utóbbi a gyorsító programja révén támogatta az indítást). „A Composo egy kritikus szűk keresztmetszetet foglalkozik az Enterprise AI elfogadása során” – mondta a Twin Path szóvivője egy nyilatkozatában.
Ez a szűk keresztmetszet nagy probléma az általános AI mozgalom számára, különösen az Enterprise szegmensben – mondta Fox. „Az emberek túl vannak az izgalom hype -jén, és most azt gondolják:„ Nos, valójában ez megváltoztatja -e valamit a vállalkozásomról a jelenlegi formájában? Mert ez nem elég megbízható, és nem elég következetes. És még ha igen is, nem tudod bizonyítani, hogy mennyi az. ” – mondta.
Ez a szűk keresztmetszet értékesebbé teheti a Composo -t azoknak a vállalatoknak, amelyek az AI -t akarják végrehajtani, de ennek következtében jó hírnév kockázatot jelenthet. Fox azt mondja, hogy ez az oka annak, hogy cége iparági agnosztikusnak tűnt, de még mindig rezonanciája van a megfelelés, a jogi, az egészségügyi és a biztonsági terekben.
Ami a versenytársi várárat illeti, a Fox úgy érzi, hogy az ideéréshez szükséges K + F nem triviális. „Van egyaránt a modell architektúrája, mind az adatok, amelyeket edzünk” – mondta, elmagyarázva, hogy a Composo Align -t „a szakértői értékelések nagy adatkészletére” képezték.
Még mindig felmerül a kérdés, hogy mit tehetnek a technológiai óriások, ha egyszerűen csak a hatalmas háborús ládájukat csapják be, hogy belépjenek a problémára, de a Composo úgy gondolja, hogy ez első mozgatási előnye van. „A másik (dolog) az adatok, amelyeket az idő múlásával felhalmozunk” – mondta Fox, utalva arra, hogy a Composo hogyan építette fel az értékelési preferenciákat.
Mivel az alkalmazásokat a rugalmas kritériumkészlet alapján értékeli, a Composo azt is látja, hogy jobban megfelel az Agentic AI emelkedéséhez, mint a versenytársak, akik korlátozottabb megközelítést alkalmaznak. „Véleményem szerint határozottan nem vagyunk abban a szakaszban, ahol az ügynökök jól működnek, és valójában ezt próbáljuk segíteni a megoldásban” – mondta Fox.
A TechCrunchnak van egy AI-központú hírlevele! Iratkozzon fel ide, hogy minden szerdán bekerüljön a postaládájába.
(TagStotranslate) AI (T) Composo (T) Twin Path Ventures
Forrás: techcrunch.com