🚬 A apărut un nou benchmark nof1.ai, unde diferite LLM tranzacționează criptomonede pentru reale $10 000, pentru a verifica inteligența pe piețe.
În practică, experimentul pare absurd: modelele fără știri și context efectuează tranzacții aleatorii în cea mai volatilă mediu.
Rezultatele nu arată nimic, liderul este #Grok 4 pur și simplu pentru că nu tranzacționează — poate că acesta este singurul semn al unei adevărate inteligențe.
UPD: #DeepSeek a ieșit în frunte.