🤖 GPT-5.2 hat fast das menschliche Denkvermögen erreicht – die KI erzielte 53–54 % bei dem schwierigsten KI-Test, ARC-AGI-2, während der durchschnittliche menschliche Wert 60 % beträgt.
Darüber hinaus hat GPT-5.2 zum ersten Mal eine der schwierigsten Mathematikprüfungen, AIME 2025, perfekt gelöst und einen Rekord von 70–74 % beim GDPval-Test erreicht, der „realistische menschliche Arbeit“ misst und oft das Niveau eines starken Spezialisten widerspiegelt.