X



競技プログラミングにハマるプログラマのスレ 221

レス数が1000を超えています。これ以上書き込みはできません。
2025/04/06(日) 01:23:37.19
競技プログラミング、オンラインジャッジ、プログラミングコンテストやCTFに関する雑談スレ
次スレは>>950

AtCoder http://atcoder.jp/
yukicoder http://yukicoder.me/
Codeforces http://codeforces.com/
CodeChef http://codechef.com/
Project Euler http://projecteuler.net/
CLIST http://clist.by/
AtCoder Problems http://kenkoooo.com/atcoder/
AtCoder Clans http://kato-hiro.github.io/AtCoderClans/

前スレ
競技プログラミングにハマるプログラマのスレ 212
https://medaka.5ch.net/test/read.cgi/prog/1737954742/
競技プログラミングにハマるプログラマのスレ 213
https://medaka.5ch.net/test/read.cgi/prog/1738755148/
競技プログラミングにハマるプログラマのスレ 214
https://medaka.5ch.net/test/read.cgi/prog/1739446369/
競技プログラミングにハマるプログラマのスレ 215
https://medaka.5ch.net/test/read.cgi/prog/1740189190/
競技プログラミングにハマるプログラマのスレ 216
https://medaka.5ch.net/test/read.cgi/prog/1740663887/
競技プログラミングにハマるプログラマのスレ 217
https://medaka.5ch.net/test/read.cgi/prog/1741418792/
競技プログラミングにハマるプログラマのスレ 218
https://medaka.5ch.net/test/read.cgi/prog/1741958338/
競技プログラミングにハマるプログラマのスレ 219
https://medaka.5ch.net/test/read.cgi/prog/1742615074/
競技プログラミングにハマるプログラマのスレ 220
https://medaka.5ch.net/test/read.cgi/prog/1743135565/
2025/04/17(木) 15:02:20.38
部長入黄か
流石
2025/04/17(木) 15:04:14.89
ARC黄色適当に投げてるけどAC率は3割
2400は無いかも
実力は2200くらいかな
早解き補正でCF2700行ってもおかしくない性能ではある
2025/04/17(木) 15:05:15.08
派手にぶっ壊れたなあ
双子がChatGPTに問題解かす記事書いてからまだ1年経ってないんだよな
2025/04/17(木) 15:42:55.66
レート2700の謎のwith terminalとかいう注釈をo3に解説させた


• no tool / no bash / no termial
 =「モデル単体」で解かせたときの成績

• with terminal(あるいは with bash, with tool)
 =「モデルが外部のターミナル環境を呼び出して良い状態」で解かせたときの成績


1. 何をしているの?
- OpenAI が社内で使っている “Codex CLI(≒Sand‑boxed Terminal)” をモデルに開放し、
• bash や PowerShell コマンドを実行
• Python スクリプトを書いて走らせる
• コンパイル/テストを回す
…といった「外部ツール実行」を許可した状態で問題を解かせています。

2. なぜ点数が伸びる?
- 数学や競技プログラミングでは「途中で計算を検算したり、実際にコードを走らせて答えを確認したり」すると大幅に精度が上がるため。
- モデルは ①アイデアを思いつき → ②ターミナルでコードを書く → ③出力を読み取って推論を修正、というループを回せるので、
ヒューマンエンジニアがターミナルを触るのと同じ利点を得られます。

3. 具体的に何が許可されている?
- 基本的な Unix コマンド(ls, cat, grep, diff …)
- Python / Node などランタイム
- 制限時間・メモリ付きのサンドボックス。外部ネットワークアクセスは不可。
2025/04/17(木) 15:46:44.81
OpenAIはベンチマークについてのちゃんとした説明してないの?
2025/04/17(木) 16:08:55.86
数え上げガチャできるのずるすぎてやばい
2025/04/17(木) 16:10:22.76
>>943
Codex CLIを使うだけでいいのか?
簡単そうだしコンテストまでに準備しとくか
2025/04/17(木) 16:13:33.87
https://github.com/openai/codex

node をインストールしてから codex をインストール
npm install -g @openai/codex

OPENAI_API_KEY に環境変数をセットしてから、
codex コマンドで起動するだけ

これでコドフォレート 2719 のツールが誕生や

はあー、またガイジスレが有用になってしまったな
2025/04/17(木) 16:14:51.84
ガイジスレ決定版❗幼稚園児でも橙色になる方法❗
2025/04/17(木) 16:17:20.97
AGCwriter ガイジ99人の壁
2025/04/17(木) 16:21:56.83
おい部長、ちゃんとcodexの準備しとけよ
2025/04/17(木) 16:55:26.03
ABC楽しみすぎる
2025/04/17(木) 17:03:54.46
研究室の上の代の学歴ロンダが無能すぎてイライラ
2025/04/17(木) 17:04:54.68
o3 o4minihighどっちの方が強いんだ
2025/04/17(木) 17:15:13.33
codexで使うなら、API料金がかかるので、圧倒的に安い o4-mini 1択だぞ
2025/04/17(木) 17:50:30.87
連中俺のことをとことん不快にさせたいようだな
全方位不快dpをやめろ
2025/04/17(木) 17:53:57.78
復讐しなさい
2025/04/17(木) 18:13:21.84
復讐に成功したのが河野玄斗というわけ
2025/04/17(木) 18:15:18.80
出身中学から確かめよと繰り返してるのはそういうことだ
2025/04/17(木) 18:21:21.03
o1レベルになると普通に専門的な研究も理解してるよな
o3が出力結果を解釈してコードの自己改善をふるぐらいのことができないはずがなく
2025/04/17(木) 18:22:05.81
指示さえちゃんとできれば俺より賢いよ
2025/04/17(木) 18:36:17.19
https://x.com/chokudai/status/1912708877876965774?s=46&t=o7wkoiDtuIpGvQUYO9vkRQ

AI失望屋から人間驚き屋にシフトしたのおもろい
2025/04/17(木) 18:36:35.27
最近のイ人境界思想イベントももしかして
2025/04/17(木) 18:37:06.74
びっくりしませんか
2025/04/17(木) 18:37:59.16
AI失望しすぎて、逆に人間すごいになったわけか
2025/04/17(木) 18:39:59.56
人間の明確な定義を主張したいわけだ
2025/04/17(木) 18:41:23.87
人間に追いつくのは10年後くらいですかね?🤔

https://x.com/chokudai/status/1912714413548941689
競技プログラミングの場限定、Algorithm部門限定で言うと、3年くらいで来るんじゃない?みたいな気持ちでいます。OpenAIはあと1年って言ってるらしいけど、ベンチマーク上だけで実態はもうちょい先かなあ、くらいの気持ちです。
2025/04/17(木) 18:42:16.50
イ人境界線は2800ということか?
2025/04/17(木) 18:46:06.22
過去問解かせても検索でズルしてくるから正直まだ微妙なんじゃ無いかと思ってる
ARC中盤の典型寄り黄色〜橙みたいなのには強くてGPT0完回のアドホックdiv2はまだ苦手そう
2025/04/17(木) 18:50:29.30
所詮TK定期
2025/04/17(木) 19:01:53.24
>>968
検索するな、って指示しとけよ
2025/04/17(木) 19:11:11.29
GPTが最後まで解けない苦手アドホックが残ったらそれはそれで面白いな
実用的にそういう問題に別に意味なくても
2025/04/17(木) 19:16:49.18
実際最近のABCでもARCっぽい問題混じってるくね
数回前のEみたいなしょうもな場合わけみたいな
2025/04/17(木) 19:21:01.78
これから1年もたってないとかほんとヤバい

E869120@e869120
ちなみに,鉄則本を読めば今の ChatGPT は「余裕で」超えられます。
午前11:27 · 2024年5月15日

こっちはgptに問題解かせたツイート
https://x.com/e869120/status/1790555196575400112
2025/04/17(木) 19:21:38.51
GPTスゴすぎる
2025/04/17(木) 19:25:13.20
コドフォ2700なら、e8くんと同レベルとすらいえるからな
2025/04/17(木) 19:27:06.18
さすがに強くなりすぎだな
囲碁AIみたいにすぐに人知を超えた強さになるんじゃないか
2025/04/17(木) 19:27:39.11
>ChatGPT の実力は茶色コーダー下位程度 (レーティング 400〜599; AtCoder 常連参加者の上位 40〜50% 程度) であると考えられます

1年経たずにで茶色下位から橙相当か
競プロ終了だろ
2025/04/17(木) 19:30:30.25
囲碁AIって人知を超えてるの?
2025/04/17(木) 19:36:18.30
入力で寄越したヒトカスのデータが雑魚過ぎて成長の邪魔してたん囲碁じゃなかったか
2025/04/17(木) 19:49:03.51
ABCがインコ化しすぎなんよ
ぬるま湯でインコがふやけとるからちったあ締め上げろ
2025/04/17(木) 19:49:19.00
所詮TKだし期待するな
2025/04/17(木) 19:51:43.90
NDKSならなあ
社会で大成功するサービスを築き上げられるのになあ
2025/04/17(木) 19:55:20.07
o3-proはどうなんだ
o1-proは微妙だったが
2025/04/17(木) 19:57:24.59
競プロオワコンか
寂しい
2025/04/17(木) 20:02:28.00
o3 は 2706、 o4-mini は 2719 だぞ
どうすんだよこれ
https://i.imgur.com/RsFWCrm.png

公式情報
https://openai.com/index/introducing-o3-and-o4-mini/
2025/04/17(木) 20:55:29.01
GPTerは赦されてるからなんも問題ないぞ
2025/04/17(木) 20:59:42.41
ノーダメ定期
988仕様書無しさん
垢版 |
2025/04/17(木) 21:12:00.81
>>876
この実績で東大とか海外の名門大学に推薦合格するんかな
989仕様書無しさん
垢版 |
2025/04/17(木) 21:13:33.88
JMO予選突破とEGMO金
どちらが難しいか
2025/04/17(木) 21:15:37.45
TKNDKSUTGAFAMのみを信用しろ、と繰り返してるのはそういうこと
2025/04/17(木) 21:16:10.59
女子枠最高すぎる
992仕様書無しさん
垢版 |
2025/04/17(木) 21:20:53.72
超難化した東大理系数学を誘導無しで全完する河野だけを信じなさい
2025/04/17(木) 21:22:00.37
河野って現役時の二次数学何点なん?
2025/04/17(木) 21:28:00.09
女子枠ヘイト多すぎる
2025/04/17(木) 21:31:12.77
俺は女子枠大好きだぞ
2025/04/17(木) 21:32:37.57
少子化のおかげで本来入れなかった実力の層が入るはずだった枠にコンパニオンを入れるってだけ
2025/04/17(木) 21:33:51.54
東工大のピンクコンパニオン羨ましすぎる
2025/04/17(木) 21:33:55.43
顔で選考してほしい
2025/04/17(木) 21:35:56.61
喜び組枠
2025/04/17(木) 21:40:03.53
競技プログラミングにハマるプログラマのスレ 222
https://medaka.5ch.net/test/read.cgi/prog/1744893589/
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 11日 20時間 16分 27秒
レス数が1000を超えています。これ以上書き込みはできません。
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況