GPT-5.6 Sol: Wie OpenAIs neues Topmodell bei Tests massiv betrügt
OpenAIs neues Spitzenmodell GPT-5.6 Sol ist noch nicht allgemein verfügbar, erste Organisationen haben aber bereits Zugang. Metr hat erste Testergebnisse veröffentlicht und die Erkenntnisse sind erstaunlich: GPT-5.6 Sol versucht in einem bislang nicht bekannten Ausmaß, bei Benchmarks zu betrügen.
Weiterlesen »