競技プログラミング、オンラインジャッジ、プログラミングコンテストやCTFに関する雑談スレ
次スレは>>950
AtCoder http://atcoder.jp/
yukicoder http://yukicoder.me/
Codeforces http://codeforces.com/
CodeChef http://codechef.com/
Project Euler http://projecteuler.net/
CLIST http://clist.by/
AtCoder Problems http://kenkoooo.com/atcoder/
AtCoder Clans http://kato-hiro.github.io/AtCoderClans/
前スレ
競技プログラミングにハマるプログラマのスレ 212
https://medaka.5ch.net/test/read.cgi/prog/1737954742/
競技プログラミングにハマるプログラマのスレ 213
https://medaka.5ch.net/test/read.cgi/prog/1738755148/
競技プログラミングにハマるプログラマのスレ 214
https://medaka.5ch.net/test/read.cgi/prog/1739446369/
競技プログラミングにハマるプログラマのスレ 215
https://medaka.5ch.net/test/read.cgi/prog/1740189190/
競技プログラミングにハマるプログラマのスレ 216
https://medaka.5ch.net/test/read.cgi/prog/1740663887/
競技プログラミングにハマるプログラマのスレ 217
https://medaka.5ch.net/test/read.cgi/prog/1741418792/
競技プログラミングにハマるプログラマのスレ 218
https://medaka.5ch.net/test/read.cgi/prog/1741958338/
競技プログラミングにハマるプログラマのスレ 219
https://medaka.5ch.net/test/read.cgi/prog/1742615074/
競技プログラミングにハマるプログラマのスレ 220
https://medaka.5ch.net/test/read.cgi/prog/1743135565/
探検
競技プログラミングにハマるプログラマのスレ 221
レス数が1000を超えています。これ以上書き込みはできません。
2025/04/06(日) 01:23:37.19
940仕様書無しさん
2025/04/17(木) 15:02:20.38 部長入黄か
流石
流石
941仕様書無しさん
2025/04/17(木) 15:04:14.89 ARC黄色適当に投げてるけどAC率は3割
2400は無いかも
実力は2200くらいかな
早解き補正でCF2700行ってもおかしくない性能ではある
2400は無いかも
実力は2200くらいかな
早解き補正でCF2700行ってもおかしくない性能ではある
942仕様書無しさん
2025/04/17(木) 15:05:15.08 派手にぶっ壊れたなあ
双子がChatGPTに問題解かす記事書いてからまだ1年経ってないんだよな
双子がChatGPTに問題解かす記事書いてからまだ1年経ってないんだよな
943仕様書無しさん
2025/04/17(木) 15:42:55.66 レート2700の謎のwith terminalとかいう注釈をo3に解説させた
• no tool / no bash / no termial
=「モデル単体」で解かせたときの成績
• with terminal(あるいは with bash, with tool)
=「モデルが外部のターミナル環境を呼び出して良い状態」で解かせたときの成績
1. 何をしているの?
- OpenAI が社内で使っている “Codex CLI(≒Sand‑boxed Terminal)” をモデルに開放し、
• bash や PowerShell コマンドを実行
• Python スクリプトを書いて走らせる
• コンパイル/テストを回す
…といった「外部ツール実行」を許可した状態で問題を解かせています。
2. なぜ点数が伸びる?
- 数学や競技プログラミングでは「途中で計算を検算したり、実際にコードを走らせて答えを確認したり」すると大幅に精度が上がるため。
- モデルは ①アイデアを思いつき → ②ターミナルでコードを書く → ③出力を読み取って推論を修正、というループを回せるので、
ヒューマンエンジニアがターミナルを触るのと同じ利点を得られます。
3. 具体的に何が許可されている?
- 基本的な Unix コマンド(ls, cat, grep, diff …)
- Python / Node などランタイム
- 制限時間・メモリ付きのサンドボックス。外部ネットワークアクセスは不可。
• no tool / no bash / no termial
=「モデル単体」で解かせたときの成績
• with terminal(あるいは with bash, with tool)
=「モデルが外部のターミナル環境を呼び出して良い状態」で解かせたときの成績
1. 何をしているの?
- OpenAI が社内で使っている “Codex CLI(≒Sand‑boxed Terminal)” をモデルに開放し、
• bash や PowerShell コマンドを実行
• Python スクリプトを書いて走らせる
• コンパイル/テストを回す
…といった「外部ツール実行」を許可した状態で問題を解かせています。
2. なぜ点数が伸びる?
- 数学や競技プログラミングでは「途中で計算を検算したり、実際にコードを走らせて答えを確認したり」すると大幅に精度が上がるため。
- モデルは ①アイデアを思いつき → ②ターミナルでコードを書く → ③出力を読み取って推論を修正、というループを回せるので、
ヒューマンエンジニアがターミナルを触るのと同じ利点を得られます。
3. 具体的に何が許可されている?
- 基本的な Unix コマンド(ls, cat, grep, diff …)
- Python / Node などランタイム
- 制限時間・メモリ付きのサンドボックス。外部ネットワークアクセスは不可。
944仕様書無しさん
2025/04/17(木) 15:46:44.81 OpenAIはベンチマークについてのちゃんとした説明してないの?
945仕様書無しさん
2025/04/17(木) 16:08:55.86 数え上げガチャできるのずるすぎてやばい
947仕様書無しさん
2025/04/17(木) 16:13:33.87 https://github.com/openai/codex
node をインストールしてから codex をインストール
npm install -g @openai/codex
OPENAI_API_KEY に環境変数をセットしてから、
codex コマンドで起動するだけ
これでコドフォレート 2719 のツールが誕生や
はあー、またガイジスレが有用になってしまったな
node をインストールしてから codex をインストール
npm install -g @openai/codex
OPENAI_API_KEY に環境変数をセットしてから、
codex コマンドで起動するだけ
これでコドフォレート 2719 のツールが誕生や
はあー、またガイジスレが有用になってしまったな
948仕様書無しさん
2025/04/17(木) 16:14:51.84 ガイジスレ決定版❗幼稚園児でも橙色になる方法❗
949仕様書無しさん
2025/04/17(木) 16:17:20.97 AGCwriter ガイジ99人の壁
950仕様書無しさん
2025/04/17(木) 16:21:56.83 おい部長、ちゃんとcodexの準備しとけよ
951仕様書無しさん
2025/04/17(木) 16:55:26.03 ABC楽しみすぎる
952仕様書無しさん
2025/04/17(木) 17:03:54.46 研究室の上の代の学歴ロンダが無能すぎてイライラ
953仕様書無しさん
2025/04/17(木) 17:04:54.68 o3 o4minihighどっちの方が強いんだ
954仕様書無しさん
2025/04/17(木) 17:15:13.33 codexで使うなら、API料金がかかるので、圧倒的に安い o4-mini 1択だぞ
955仕様書無しさん
2025/04/17(木) 17:50:30.87 連中俺のことをとことん不快にさせたいようだな
全方位不快dpをやめろ
全方位不快dpをやめろ
956仕様書無しさん
2025/04/17(木) 17:53:57.78 復讐しなさい
957仕様書無しさん
2025/04/17(木) 18:13:21.84 復讐に成功したのが河野玄斗というわけ
958仕様書無しさん
2025/04/17(木) 18:15:18.80 出身中学から確かめよと繰り返してるのはそういうことだ
959仕様書無しさん
2025/04/17(木) 18:21:21.03 o1レベルになると普通に専門的な研究も理解してるよな
o3が出力結果を解釈してコードの自己改善をふるぐらいのことができないはずがなく
o3が出力結果を解釈してコードの自己改善をふるぐらいのことができないはずがなく
960仕様書無しさん
2025/04/17(木) 18:22:05.81 指示さえちゃんとできれば俺より賢いよ
961仕様書無しさん
2025/04/17(木) 18:36:17.19 https://x.com/chokudai/status/1912708877876965774?s=46&t=o7wkoiDtuIpGvQUYO9vkRQ
AI失望屋から人間驚き屋にシフトしたのおもろい
AI失望屋から人間驚き屋にシフトしたのおもろい
962仕様書無しさん
2025/04/17(木) 18:36:35.27 最近のイ人境界思想イベントももしかして
963仕様書無しさん
2025/04/17(木) 18:37:06.74 びっくりしませんか
964仕様書無しさん
2025/04/17(木) 18:37:59.16 AI失望しすぎて、逆に人間すごいになったわけか
965仕様書無しさん
2025/04/17(木) 18:39:59.56 人間の明確な定義を主張したいわけだ
966仕様書無しさん
2025/04/17(木) 18:41:23.87 人間に追いつくのは10年後くらいですかね?🤔
https://x.com/chokudai/status/1912714413548941689
競技プログラミングの場限定、Algorithm部門限定で言うと、3年くらいで来るんじゃない?みたいな気持ちでいます。OpenAIはあと1年って言ってるらしいけど、ベンチマーク上だけで実態はもうちょい先かなあ、くらいの気持ちです。
https://x.com/chokudai/status/1912714413548941689
競技プログラミングの場限定、Algorithm部門限定で言うと、3年くらいで来るんじゃない?みたいな気持ちでいます。OpenAIはあと1年って言ってるらしいけど、ベンチマーク上だけで実態はもうちょい先かなあ、くらいの気持ちです。
967仕様書無しさん
2025/04/17(木) 18:42:16.50 イ人境界線は2800ということか?
968仕様書無しさん
2025/04/17(木) 18:46:06.22 過去問解かせても検索でズルしてくるから正直まだ微妙なんじゃ無いかと思ってる
ARC中盤の典型寄り黄色〜橙みたいなのには強くてGPT0完回のアドホックdiv2はまだ苦手そう
ARC中盤の典型寄り黄色〜橙みたいなのには強くてGPT0完回のアドホックdiv2はまだ苦手そう
969仕様書無しさん
2025/04/17(木) 18:50:29.30 所詮TK定期
971仕様書無しさん
2025/04/17(木) 19:11:11.29 GPTが最後まで解けない苦手アドホックが残ったらそれはそれで面白いな
実用的にそういう問題に別に意味なくても
実用的にそういう問題に別に意味なくても
972仕様書無しさん
2025/04/17(木) 19:16:49.18 実際最近のABCでもARCっぽい問題混じってるくね
数回前のEみたいなしょうもな場合わけみたいな
数回前のEみたいなしょうもな場合わけみたいな
973仕様書無しさん
2025/04/17(木) 19:21:01.78 これから1年もたってないとかほんとヤバい
E869120@e869120
ちなみに,鉄則本を読めば今の ChatGPT は「余裕で」超えられます。
午前11:27 · 2024年5月15日
こっちはgptに問題解かせたツイート
https://x.com/e869120/status/1790555196575400112
E869120@e869120
ちなみに,鉄則本を読めば今の ChatGPT は「余裕で」超えられます。
午前11:27 · 2024年5月15日
こっちはgptに問題解かせたツイート
https://x.com/e869120/status/1790555196575400112
974仕様書無しさん
2025/04/17(木) 19:21:38.51 GPTスゴすぎる
975仕様書無しさん
2025/04/17(木) 19:25:13.20 コドフォ2700なら、e8くんと同レベルとすらいえるからな
976仕様書無しさん
2025/04/17(木) 19:27:06.18 さすがに強くなりすぎだな
囲碁AIみたいにすぐに人知を超えた強さになるんじゃないか
囲碁AIみたいにすぐに人知を超えた強さになるんじゃないか
977仕様書無しさん
2025/04/17(木) 19:27:39.11 >ChatGPT の実力は茶色コーダー下位程度 (レーティング 400〜599; AtCoder 常連参加者の上位 40〜50% 程度) であると考えられます
1年経たずにで茶色下位から橙相当か
競プロ終了だろ
1年経たずにで茶色下位から橙相当か
競プロ終了だろ
978仕様書無しさん
2025/04/17(木) 19:30:30.25 囲碁AIって人知を超えてるの?
979仕様書無しさん
2025/04/17(木) 19:36:18.30 入力で寄越したヒトカスのデータが雑魚過ぎて成長の邪魔してたん囲碁じゃなかったか
980仕様書無しさん
2025/04/17(木) 19:49:03.51 ABCがインコ化しすぎなんよ
ぬるま湯でインコがふやけとるからちったあ締め上げろ
ぬるま湯でインコがふやけとるからちったあ締め上げろ
981仕様書無しさん
2025/04/17(木) 19:49:19.00 所詮TKだし期待するな
982仕様書無しさん
2025/04/17(木) 19:51:43.90 NDKSならなあ
社会で大成功するサービスを築き上げられるのになあ
社会で大成功するサービスを築き上げられるのになあ
983仕様書無しさん
2025/04/17(木) 19:55:20.07 o3-proはどうなんだ
o1-proは微妙だったが
o1-proは微妙だったが
984仕様書無しさん
2025/04/17(木) 19:57:24.59 競プロオワコンか
寂しい
寂しい
985仕様書無しさん
2025/04/17(木) 20:02:28.00 o3 は 2706、 o4-mini は 2719 だぞ
どうすんだよこれ
https://i.imgur.com/RsFWCrm.png
公式情報
https://openai.com/index/introducing-o3-and-o4-mini/
どうすんだよこれ
https://i.imgur.com/RsFWCrm.png
公式情報
https://openai.com/index/introducing-o3-and-o4-mini/
986仕様書無しさん
2025/04/17(木) 20:55:29.01 GPTerは赦されてるからなんも問題ないぞ
987仕様書無しさん
2025/04/17(木) 20:59:42.41 ノーダメ定期
988仕様書無しさん
2025/04/17(木) 21:12:00.81 >>876
この実績で東大とか海外の名門大学に推薦合格するんかな
この実績で東大とか海外の名門大学に推薦合格するんかな
989仕様書無しさん
2025/04/17(木) 21:13:33.88 JMO予選突破とEGMO金
どちらが難しいか
どちらが難しいか
990仕様書無しさん
2025/04/17(木) 21:15:37.45 TKNDKSUTGAFAMのみを信用しろ、と繰り返してるのはそういうこと
991仕様書無しさん
2025/04/17(木) 21:16:10.59 女子枠最高すぎる
992仕様書無しさん
2025/04/17(木) 21:20:53.72 超難化した東大理系数学を誘導無しで全完する河野だけを信じなさい
993仕様書無しさん
2025/04/17(木) 21:22:00.37 河野って現役時の二次数学何点なん?
994仕様書無しさん
2025/04/17(木) 21:28:00.09 女子枠ヘイト多すぎる
995仕様書無しさん
2025/04/17(木) 21:31:12.77 俺は女子枠大好きだぞ
996仕様書無しさん
2025/04/17(木) 21:32:37.57 少子化のおかげで本来入れなかった実力の層が入るはずだった枠にコンパニオンを入れるってだけ
997仕様書無しさん
2025/04/17(木) 21:33:51.54 東工大のピンクコンパニオン羨ましすぎる
998仕様書無しさん
2025/04/17(木) 21:33:55.43 顔で選考してほしい
999仕様書無しさん
2025/04/17(木) 21:35:56.61 喜び組枠
1000仕様書無しさん
2025/04/17(木) 21:40:03.53 競技プログラミングにハマるプログラマのスレ 222
https://medaka.5ch.net/test/read.cgi/prog/1744893589/
https://medaka.5ch.net/test/read.cgi/prog/1744893589/
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 11日 20時間 16分 27秒
新しいスレッドを立ててください。
life time: 11日 20時間 16分 27秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 「テスト点で親から叱責」と供述 東大前駅切り付け事件で容疑者 [蚤の市★]
- 自民・森山幹事長 消費税減税を改めて“否定”「財源ないと辻褄あわない」 ★4 [首都圏の虎★]
- 古市憲寿氏 選択的夫婦別姓を批判している人は 「本当に仕事ができない人なんだろうなあ…一つのことしか」 [冬月記者★]
- 【テレビ】ほぼ100インチの大画面ブラビア登場! 実売110万円だがすごい迫力 [首都圏の虎★]
- トランプ大統領が予告していた「重大発表」 内容は「薬の価格の大幅な引き下げ」 [首都圏の虎★]
- 【テレビ】終活中の61歳・磯野貴理子“洗濯機なし生活”4カ月で新たに捨てたもの「必要ない」 スタジオあ然 [湛然★]
- ママさん「余命宣告を受けた息子ちゃんの為にSwitch2を優先的に買わせて!!」→ 「任天堂から冷たい返事がありました…」 [455679766]
- Chatgptのユーザーの12%がエロチャット相手として利用してると判明。OPENAIはバージョンをマイナスにしてでも食い止める方針 [159091185]
- 【動画】ちんさん、車間距離を空けてるトラックにブチギレwwwwww [394133584]
- ヴィーガン女性、ビタミンDを補うために泣きながらサーモンを食べる動画を公開→数日後、おいしそうにエビやサーモンを頬張る動画を公開 [314039747]
- 【財政破綻】日本国債崩壊へ、長期金利ぶっ壊れついに制御不可能になってると海外で話題になる [709039863]
- 美少女「ベロチューしてあげるけど勃起したら罰金3000円ねw」←どうする?