Pubblicato inApprofondimenti

ARC-AGI 3: la vera AGI è ancora lontana

ARC-AGI 3 è il nuovo benchmark della ARC Prize Foundation che misura l’efficienza adattiva dei modelli AI rispetto agli esseri umani. Al lancio, nessun modello commerciale supera lo 0,4%: Gemini 3.1 Pro guida con 0,37%, GPT 5.4 segna 0,26%, Opus 4.6 si ferma a 0,25%, Grok-4.2 a 0%.