2024.szeptember 16.
Edit, Ciprián
Hírek 🔊

A ChatGPT készítői titokban új típusú mesterséges intelligenciát fejlesztenek

Facebook
Email
Telegram
Twitter
VK
Nyomtat
[object Object]

Adja hozzá a VDTA friss híreit a Google hírfolyamához

A ChatGPT-t létrehozó OpenAI a mesterséges intelligencia modelljeinek új megközelítésén dolgozik a “Strawberry” kódnevű projektben, egy, az ügyet ismerő személy és a Reuters által áttekintett belső dokumentáció szerint.

A projekt, amelynek részleteiről korábban nem számoltak be, a Microsoft által támogatott startup verseny része annak bemutatására, hogy az általa kínált modellek képesek fejlett érvelési képességek biztosítására.

Az OpenAI-n belül több csapat is dolozik a Strawberry-n, egy nemrégiben készült belső OpenAI dokumentum másolata szerint, amelyet a Reuters látott májusban.

A Strawberry működése még az OpenAI-n belül is szigorúan őrzött titok, mondta az illető.
A dokumentum egy olyan projektet ír le, amely Strawberry modelleket használ azzal a céllal, hogy lehetővé tegye a vállalat mesterséges intelligenciája számára, hogy ne csak válaszokat generáljon a lekérdezésekre, hanem elég előre tervezzen ahhoz, hogy önállóan és megbízhatóan navigáljon az interneten, hogy elvégezze azt, amit az OpenAI “mély kutatásnak” nevez.

Ez olyasvalami, ami eddig nem volt jellemző az MI modellekre, több mint egy tucat MI kutatóval készített interjú szerint.

Amikor a Strawberry és a történetben közölt részletek felől kérdezték, az OpenAI cég szóvivője nyilatkozatában azt mondta: “Azt akarjuk, hogy MI modelljeink jobban lássák és megértsék a világot, mint mi. Az új MI-képességek folyamatos kutatása általános gyakorlat az iparágban, és közös meggyőződés, hogy ezek a rendszerek idővel javulni fognak az érvelésben.

A Strawberry projekt korábban Q* néven volt ismert, amit a Reuters tavaly már áttörésnek tekintett a vállalaton belül.

Két forrás arról számolt be, hogy az év elején az OpenAI munkatársai azt mondták nekik, hogy Q* demók képesek megválaszolni a trükkös tudományos és matematikai kérdéseket, amelyek a mai kereskedelmi forgalomban kapható modellek számára elérhetetlenek.

Kedden egy belső találkozón az OpenAI bemutatott egy kutatási projektet, amelyről azt állította, hogy új, emberszerű érvelési képességekkel rendelkezik, a Bloomberg szerint. Az OpenAI szóvivője megerősítette a találkozót, de nem volt hajlandó részleteket közölni.

Az OpenAI reméli, hogy az innováció drámaian javítja az MI modellek érvelési képességeit, mondta az azt ismerő személy, hozzátéve, hogy a Strawberry magában foglalja az MI modell feldolgozásának speciális módját, miután azt nagyon nagy adatkészleteken előzetesen betanították.

A Reuters által megkérdezett kutatók szerint az érvelés kulcsfontosságú ahhoz, hogy az MI emberi vagy szuper-emberi szintű intelligenciát érjen el.

Míg a nagy nyelvi modellek már képesek hosszú szövegeket összefoglalni és elegáns prózát komponálni sokkal gyorsabban, mint bármely ember, a technológia gyakran elmarad a józan ész problémáitól, amelyek megoldásai intuitívnak tűnnek az emberek számára, mint például a logikai tévedések felismerése és az amőba játék. Amikor a modell ilyen jellegű problémákkal találkozik, gyakran hamis információkat “hallucinál“.

A Reuters által megkérdezett MI-kutatók általában egyetértenek abban, hogy az érvelés az MI kontextusában magában foglalja egy olyan modell kialakítását, amely lehetővé teszi az MI számára, hogy előre tervezzen, tükrözze a fizikai világ működését, és megbízhatóan dolgozzon a kihívást jelentő többlépcsős problémákon.

Az MI-modellek érvelésének javítása kulcsfontosságú ahhoz, hogy a modellek mindent megtehessenek a jelentős tudományos felfedezésektől az új szoftveralkalmazások tervezéséig és létrehozásáig.

Sam Altman, az OpenAI vezérigazgatója az év elején azt mondta, hogy új lapot nyit meg, hogy “a fejlődés legfontosabb területei az érvelési képesség körül lesznek“.

Más vállalatok, például a Google, a Meta és a Microsoft szintén különböző technikákkal kísérleteznek az MI-modellek érvelésének javítására, csakúgy, mint a legtöbb akadémiai laboratórium, amely MI-kutatást végez. A kutatók azonban eltérnek abban, hogy a nagy nyelvi modellek (LLM-ek) képesek-e ötleteket és hosszú távú tervezést beépíteni az előrejelzésbe. Például a modern MI egyik úttörője, Yann LeCun, aki a Metánál dolgozik, gyakran mondta, hogy az LLM-ek nem képesek emberi érvelésre.

MI kihívások

A Strawberry kulcsfontosságú eleme az OpenAI tervének, hogy leküzdje ezeket a kihívásokat, mondta az ügyet ismerő forrás. A Reuters által látott dokumentum leírja, hogy a Strawberry mit kíván lehetővé tenni, de azt nem, hogyan.

Az elmúlt hónapokban a vállalat magánúton jelezte a fejlesztőknek és más külső feleknek, hogy a lényegesen fejlettebb érvelési képességekkel rendelkező technológia kiadásának küszöbén áll, négy ember szerint, akik ismerik a részleteket.

A Strawberry magában foglalja az OpenAI generatív MI modelljeinek úgynevezett “betanítás utáni” speciális módját, vagy az alapmodellek adaptálását, hogy meghatározott módon csiszolják teljesítményüket, miután már “betanították” őket az általánosított adatok halmazán, mondta az egyik forrás.

A modell fejlesztésének betanítás utáni fázisa olyan módszereket foglal magában, mint a “finomhangolás,” egy olyan folyamat, amelyet manapság szinte minden nyelvi modellben használnak, és amely sokféle változatban létezik, például az emberek visszajelzést adnak a modellnek a válaszai alapján, és példákat adnak neki a jó és rossz válaszokra.

A Strawberry hasonlóságot mutat a Stanfordon 2022-ben kifejlesztett módszerrel, amelyet “Self-Teach Reasoner” vagy “STaR“-nak neveztek el – mondta az ügyet ismerő egyik forrás. A STaR lehetővé teszi az MI modellek számára, hogy saját betanítási adataik iteratív létrehozásával magasabb intelligenciaszintre “bootstrapeljék” magukat, és elméletileg felhasználhatók arra, hogy a nyelvi modellek meghaladják az emberi szintű intelligenciát – mondta az egyik alkotója, Noah Goodman, a Stanford professzora.

Szerintem ez egyszerre izgalmas és rémisztő… ha a dolgok továbbra is ebbe az irányba haladnak, akkor emberként komoly dolgokra kell gondolnunk,” – mondta Goodman. Goodman nem áll kapcsolatban az OpenAI-al, és nem ismeri a Strawberry-t.

Az OpenAI által megcélzott képességek között szerepel a hosszú távú feladatok (LHT) végrehajtása, mondja a dokumentum, utalva olyan összetett feladatokra, amelyek megkövetelik a modelltől, hogy előre tervezzen és hosszabb időn keresztül hajtson végre egy sor műveletet.

Ennek érdekében az OpenAI létrehozza, betanítja és kiértékeli a modelleket a vállalat által “mélykutatási” adatkészletnek nevezett adatkészletre alapozva, az OpenAI belső dokumentációja szerint.

Az OpenAI kifejezetten azt akarja, hogy modelljei ezeket a képességeket kutatásra használják az interneten való autonóm böngészéssel egy “CUA” vagy egy számítógép-használó ügynök segítségével, amely az eredmények alapján műveleteket végezhet, a dokumentum és az egyik forrás szerint. Az OpenAI azt is tervezi, hogy teszteli képességeit a szoftver- és gépi tanulási mérnökök munkájában.

Mi a reakciód?
👍tetszik
0
👍tetszik
👎nem
2
👎nem
💘szeretem
0
💘szeretem
😡dühítő
1
😡dühítő
😂vicces
0
😂vicces
😮húha
4
😮húha

Vélemény, hozzászólás?

Iratkozzon fel a Védett Társadalom Alapítvány hírlevelére!

Adja hozzá a VDTA friss híreit a Google hírfolyamához

További cikkek