OpenAIの本番提出の壁2つのケースの完成度は1週間コンテストでも戦えるレベルなのでは?と思ってたけど、この感じだと全然そんなことなさそう。
10時間だと人間には重すぎるタスクだったけど、長期コンテストだとまだまだ勝負にならなそうね。
x.com/Rafbill_pc/sta…
#AWTF2025