オセロ 完全読み
■ このスレッドは過去ログ倉庫に格納されています
少しずれた意見があるようだが今のPCでも十分オセロは解析できると思う。
例えば一見するとオセロの一手は10手ということだがせいぜい有効な手は2手ぐらいだろう
これで 2^60=10^18
しかしこれにαβ方により平方根程度にすむので10^9程度で済む
今のパソコンなら一秒に100万手は読めるのでだいたい1000秒程度で
計算できることになる。
つまり今のPCで解析できないのはソフトの評価が正確でなく無駄な手を読んでいるからであり、十分に局面を正確に評価が出来る
ソフトを開発すれば十分に解析は可能 >>4
勝手読み60手でおkなら1000秒どころか1秒で計算可能だろ >>9
モンテカルロを使う必要はない
なぜなら使わなくても十分強いから 実際やろうと思えば解析できるんだろ
資金の問題と、競技として終わってしまうことの危惧からやらないだけで 競技として終わってしまうようなゲームに熱中しているだなんで、
オセロをしている人たちもなんだかかわいそうだな。
50年後くらいには、すべての変化が解析されてゲームとしては終焉を迎えて、
オセロは時代の仇花だったと認識されるようになり、
今オセロをしている人たちは、かつてコンピュータのない時代に
円周率を計算していた人たちと同じような部類の人だと考えられるように
なるのかな。 >>11 全てのボードゲームに言えるけどね、ただ最善進行が見つかったからといって、それがゲームの終焉に直結するとは思わないがね。 チェッカーだって解析されたけどWMSGでやってるしな 俺のPCはpentium m 1.6G というしょぼいCPUだが40手を10日か20日かければ
ちゃんと解けてしまう。スパコンつかえば解ける? >>12
そいつら人間の能力が劇的に変わらない限りありえないことなのに馬鹿な事ばっか言ってるよな
「車が人間に比べてはるかに速く走れる。ってことは徒競争ってのは競技としての終焉を迎えてるのか?」
って問い詰めてみたいところ
徒競走って言葉を知らないから、こういうつっかかりかたしてくるんだろうな
無知って怖いもんだね
それでいて「小学校で〜」なんてフレーズを使っているとこなんか、もうね・・・ もしかしたら「徒」のところでつっかかってきてるのは車が走るのは徒競走じゃないって主張したいのかな?
本質から外れすぎてて気がつかなかったよ・・・
もしそうだとしたら読解力ないね>>18は ついに曖昧でわけの分からない造語作っちゃったよこのゆとり・・・
なんだよ文章力ってw
ボキャブラリが無いから曖昧な表現でしかものを言えないんだろうな
文章力が一般的に使われてる件wwwしかも自分が知能がないのにボキャブラリーないなとか痛い奴だな >>25
一行だけなのに荒だらけで日本語とは思えん。助詞の使い方をまるで分かっていないようだ・・・
大体ボキャブラリなんてものは知識であって、知能がどうのこうのの問題じゃないし、
なんでもかんでも「文章力」なんて曖昧すぎる表現している間はボキャブラリが無いと思われても致し方ないんじゃないの?
つーか一般で使われてるとしても曖昧で広義に解釈できる単語を意味も考えずに濫用してるのだったら昨今の若者言葉と大差ないね。
こういうのって普通は使ってて恥ずかしいものだと思うけど?
あほくさ┐('〜`;)┌
そいつは自分を省みないで煽ってるだけだからこれ以上マジレスするなよ
揚げ足取りしかしてないのに、その揚げ足を取るから泥沼化してんだからさ クソスレなんだから仕様が無い
こういうスレでは馬鹿共のブーメラン合戦を静観しているのが吉 完全解析されたとしても、それを活用して勝つためには、
相手の応手に対する全ての正解の手を暗記しなきゃいけないわけよ。
対局中にコンピュータを参照してはならない、という条件のもとではね。
それは膨大な数だから、不可能。
だから、まだまだ人対人のゲームとしては成り立つ。
「お互いに最善手を打った場合の進行」を覚えるのは簡単だよ。
それは1パターンしかないから。
でも、相手はメチャクチャ打ってくるんだよ。
たとえ完全解析されていても、全ての応手を覚えるのは全く不可能。
コンピュータを適宜参照しない限り、完全解析のデータなんて役に立たない。 edax4.0が登場したがこのソフトなら完全解析できそうな感じはある スパコンに最適化されたソフトを使えば解くことも可能だが採算が合わないからやらないだけだろうな オセロは2015年あたりまでには残念ながら完全解析される オセロが完全解析されたら最善手を必要がなくなるし相手に勝つためには
定石はずしとかの邪道じみたハメ手使うしか勝つ方法がなくなる
そうなると対戦すること自体のおもしろさが激減することは間違いない
つまりオセロが完全解析されるとゲーム自体が定石はずしの競い合いに
なり名人とか世界チャンピオンとかの意味自体が薄らいでしまい
オセロの強弱自体の意味も薄らいでくるのでこれを防ぐため
オセロを完全解析されることをなんとか阻止したいところだ 完全解析される恐れのあるソフト
これらのソフトは2010年現在開発中のソフトであり
いずれも強さ解析速度ともにかつては最高といわれた
WZEBRAを大きく超えます
EDAX
ttp://abulmo.perso.neuf.fr/edax/4.0.beta/index.htm
SAIO
ttp://www.romanobenedetto.it/
HERAKLES
ttp://www.herakles.tournavitis.de/
MASTER REVERSI
ttp://homepage2.nifty.com/t_ishii/mr/index.html
これらのソフトが進化し完全解析されるとオセロゲーム自体が○×ゲーム
と同値となり競技自体が崩壊しかねないので注意しましょう。 最善手の数は6×6オセロでもわずか7であることから8×8オセロの数にしても
人間には覚えらないほどの数ではないことが予想されています。
ttp://www6.plala.or.jp/nabesoft/nbrev/derivative.html#6
仮に最善手の数が多すぎて覚えられないにしてもいかに最善を覚えるかが勝負の
鍵となってしまうのです。
結局オセロに勝つためには自ら悪手をわざとさして相手にさらなる悪手を求めること
でしか勝てなくなってしまいます。つまりハメ手を行い勝つということです。
WZEBRAでも全60手中40手を完全解析しますが現在はより強力なハード、ソフトが
多数存在します。
完全解析されると○×ゲーム並におもしろさが激減してしまうためなんとしても
解かれるのを止めたいところです。
神の言うハメ手は今現在で既に当然の事です
最後まで最善で行く手順が人の覚えれる範疇であってもー1評価で行く手順を加えるだけで手順は何倍にも増えます
それらを全て記憶するのは不可能です
つまりどう考えても暗記では行き詰まります 最善手を外れた…ってオセロする人ならわかるけど最善進行はむしろ不人気だよ
マイナス4くらいの進行が人気ある ちなみに両者最善進行の種類は何万とあります
そしてマイナス2、マイナス4、マイナス6の進行ともなれば莫大な数にります >最善手の数は6×6オセロでもわずか7
一行目から早速デタラメ
オセロの完全解析の威力はすさまじい
オセロを覚えたての子供が数少ない最善進行を覚えるだけで
世界チャンピオンと同じその高みに立ててしまう時代が来てしまうからだ
○×ゲームに強さの差は関係なくなるようにオセロでも強さは無意味になってしまう
そういう事実が世間にバレてしまうとプレイヤー自身にいままで費やしてきたオセロ
に費やしてきた時間の価値が○×ゲームを極めた人間の価値と同じように
0になってしまうのでプレイヤーとしてはなんとしても
世間にオセロがさも複雑で難解であるような印象を与えることは重要であり、世界
チャンピオンがオセロで子供の初心者で勝つためには姑息なハメ手を使うことで
しか勝てないことも明るみしてはいけない
オセロの地位崩壊を防ぐにはなるべく不利な情報は闇に葬り
完全解析への阻止運動を活発に行うことが必要
ttp://www6.plala.or.jp/nabesoft/nbrev/derivative.html#6
↑6×6の最善手に関する考察
>>46
試しに最善進行1000通り暗記して対戦してみろ
相手が最善進行がわからずにマイナス2のとこに打ったらほとんど互角なのにこっちは暗記切れでわからないってことになる。
1万通り暗記した所で相手がマイナス2、マイナス4の所に打った時に勝てる実力がないと勝てない オセロというゲームに無駄に時間をかけてない分○×ゲームを行う子供の方がオセロのチャンピオンより
全然価値は上 オセロはゲームとして死にました
オセロが一番強い奴はただの
オ ナ ニ − チャンピオンwwwww もう足を洗ったから死のうがどうしようが関係ないからw 10年くらい前からこうなることは目に見えてたのにそれを
見抜けない無能さw ある程度判断力のある人が自分の意思でオセロを趣味にするなら
ともかく、まだそういう能力を持たない子供にこのゲームに膨大な
時間を費やすように仕向けるというのは、
構造的に沈むことが分かっている泥船にそのことを隠してわざわざ
乗せるようなものであり、一種の詐欺のような側面があると思う。 コンピューター同士でオセロを対戦するGGSというサイトを見ればわかるがもうほとんどの定石ごとの最善手が確立されているようだ
チェッカーが解析されたようにオセロが解かれる日がもうすぐ来るかもしれない 牛(戦車・とかげ)はまだ大幅に研究の余地がある。
他は知らない。
【社会】12年連続、3万人超え…減らぬ自殺★2
http://tsushima.2ch.net/test/read.cgi/newsplus/1269181492/
○赤坂プリンスホテル最高級のスイート・ルームに一年中宿泊している小泉純一郎
「消えた年金」問題を追及されて、厚生大臣を歴任した時の給与返還など「金がないからできない」と述べておきながら、
赤坂プリンスホテルの最高級スイート・ルームに一年中宿泊し続けている小泉純一郎です。
その純一郎の佐藤ゆかりの応援演説でのトンデモ発言を紹介します。
【ホームレスは、野原で寝るのが好きな人】
「・・・いま、ホームレスの人もよく見かけますけども、もし東京でも、北海道でも、沖縄でも、全国、
ホームレスが「もーう、外で寝るのは飽きた」、「たまにゃあ、うちの中で寝たい」、
「風呂に入りたい」って言って、各市町村なり区役所に行けば、どの人も、全部住宅を世話する。
洋服も世話する・・・(略)しかし、「きちっとした生活はヤダ。やっぱり野原で寝たい」という人を止めるわけにはいかない・・・」
自分はホテルの高級スイートでぜいたく三昧しながら、ホームレスをバカにした発言をする小泉純一郎です。
○元次官連続殺傷事件直後にワインの試飲会に出席。
2008年11月19日『元次官連続殺傷事件』直後の11月20日に小泉純一郎は赤坂サカスにて、ワインの試飲会に出席。
かつての忠実な部下の死の衝撃さめやらぬ中、祝杯を上げました。現役閣僚、歴代の厚相が相次いでコメントを発表する中、
ワインを飲む小泉純一郎の振舞いは人間として疑問符が付くものです。
小泉純一郎は労働者をモノ扱いする制度を導入しながら、自分は特権的地位を使って贅沢三昧しているわけです。
小泉純一郎は人間失格と言うしかありません。人間失格だから犬より従属するアメ畜になれたのでしょう。
このように数多の他者を貶めながら自身は贅沢三昧に耽溺するごとき社会の不正義を放置しておけば、
日本の経済力や文化も統治の退廃に引きずられて3流・4流国家へと転落していくことでしょう。
http://wanwanlapper.se★esaa.net/article/114701364.html
オセロの高段者とかいうアホも、狭いオセロ界の中じゃ低能どもに祭られていい気なってるけど
実態は遊びに大量の時間を浪費しただけのただの馬鹿。
囲碁だって99%の人は遊び、趣味でやってて膨大な時間を浪費してるよ 囲碁はまだコンピューターがプロの足元にも及んでないレベル。
将棋・チェスも人間を超えかけているが何が最善であるかまったくわからない。
つまり強くなる価値がある。
しかしオセロだけはコンピューターの進歩によって最善手が解明されつつある。
完全に最善手がわかっている競技に強さを求める必要などない。
いずれ○×ゲームと同価値として収束する。 いや、囲碁もプロの足先くらいまではきてる。
後二十年以内に、ひざから上に来るだろう。もしかしたら胸元までくるかも。 もうすでにオセロが解かれるのは射程圏に入ってる
ttp://abulmo.perso.neuf.fr/edax/4.0/index.htm
完全解析されるとipadで局面を入力すれば簡単に答えが出るようになる
オセロ完全に死んでるな・・
局面の変化数
四目並べ=10の21乗
オセロ(6×6)=10の30乗
チェッカー=10の31乗
ドラフツ(10×10のチェッカー)=10の54乗
オセロ・リバーシ=10の58乗
連珠(五目並べの改良)=10の70乗
全宇宙の原子の数(参考)=10の78乗
グランドオセロ・パーフェクトリバーシ(10×10)=10の90乗
チェス=10の123乗
コネクト6(六目並べ)=10の140乗
シャンチー(中国将棋)=10の150乗
将棋=10の226乗
囲碁=10の360乗
中将棋と囲連星のみ不明
オセロは10×10を主体に行くといいよ。8×8は5年後には完全解析されて引き分けと言う答えが出ることでしょう。 例えばゲームのライツアウトとか、
パターン数は人間が暗記できるような桁の数じゃないけど、
必勝法は知ってれば簡単だよね。
コンピュータ参照しなくても
必勝手が分かるようなアルゴリズムがあるかも知れんよ。
配列を二進数とみなして 511 で割ったあまりの場所にいつも打てば必勝とか。
まあそんな簡単な分けないが例えばで。 >将棋=10の226乗
これって、どうやって見積もるの? >>73
そんなんじゃ出てこないでしょ。
オレがやったときは出てこなかった。
間違った説明は出てきたけど。 平均して何手で終わるかの仮定はオレの知る範囲ではデタラメ 見積もりの意味がわかってないようだが
それはデタラメじゃなくて正確性の問題なんだよ 概算見積もりと
証明付き上界下界の2パターンがある。
概算の方は基地の小さいサイズを使っての
精度の検定結果くらいは欲しいよな。
言い値でいわれてもねぇ。 10×10のグランドオセロはまだ人間はコンピュータに勝てるの?
8×8はもうコンピュータに勝てないのは分かっているんだけど いくら広くしても人間はもうコンピュータに勝てないよ。 8×8のチェッカーはとっくの昔にコンピュータに勝てないし
10×10のドラフツも勝てないらしい。
オセロは10×10に広げたぐらいではもうどうにもならんよな。10×10でさえチェスより
解析は簡単なんだし 今後の解析順予想
オセロ
↓
6路囲碁
↓
グランドオセロ
↓
7路囲碁
↓
8路囲碁
↓
9路囲碁
ここまで解析できるのに50年はかかるでしょう、10年以内に可能なのは6路囲碁とオセロだけ。更に20年してようやくグランドオセロが解析されるだろう。 >>83
グランドオセロの前に連珠も完全解析できるでしょう。現状はコンピュータが人間より強いのと
必勝パターンがかなり解析されている段階でじつはまだ完全解析とまでは行っていない。 おそらく50年以内に完全解析されるのはドラフツ、オセロ、グランドオセロ、9路囲碁までだろう。
チェスは100年はかかるんじゃない?
囲碁にいたっては1000年経っても不可能だろう。 量子コンピュータできれば、並列で全手検索できるようになって
一瞬で解析されちゃうのかな? それだけじゃだめ
量子アルゴリズムも開発されないと 自前のプログラムで途中まで完全解析してみた。
1手目まで:4通り
2手目まで:12通り
3手目まで:56通り
4手目まで:244通り
5手目まで:1396通り
6手目まで:8200通り
7手目まで:55092通り
8手目まで:390216通り
9手目まで:3005288通り
プログラムが悪いのかCPUがしょぼいのか、9手目まで完全解析するのに10秒以上かかったよ・・・。
ちなみに、再帰的方法を使って全局面数の概算も出してみた。100回のランダム試行で最大が約3.04133×10^56通り。
通説にほぼ一致という結論でいいと思う。 オセロの試合結果は何通りか? @Wikiのデータと9手目一致していませんね。
以前edaxで棋譜数を調べた際にも、何手目か以降一致しませんでした。
誤差が生じる理由はなんだ。 トランスポジション使ってるか否かじゃないの?しらんけど パスを1手に数えるか否かの違いと思われ。
パスを1手に数えない場合、
9手目:3005320通り
と出た。・・・修正プログラムを起動してから結論が出るまでに30秒くらいかかったよorz 単に考え方の違い
どの数え方が正しいかとか便利かって事は決まってない
議論が尽くされてるわけでもない 新たにパソコン購入して10手目まで完全解析出来た。
10手目まで:24571420通り
ちなみに、アルファベータ法での末端探索ノード数は以下のとおり。
1手目まで:4通り
2手目まで:10通り
3手目まで:40通り
4手目まで:119通り
5手目まで:624通り
6手目まで:2546通り
7手目まで:10783通り
8手目まで:40538通り
9手目まで:223036通り
10手目まで:882704通り
11手目まで:4662214通り
12手目まで:18286379通り
それにしても、Core2の2.88GHzでここまでしか出来ないとはorz 8×8はもう人間はコンピュータに勝てない
10×10のグランドオセロや四つの角を落とした88オセロや変則リバーシのニップスは
どうなのだろうか?グランドオセロは100年は完全解析不可能だろうけど最強の人間より強いコンピュータは
囲碁より簡単だと思う。 >>96
えっ、もう10×10で最強の人間でもコンピュータに勝てなくなっているの?
8×8はコンピュータに勝てないのは知っているんだけど 6×6が完全解析
8×8が最強の人間がコンピュータに勝てない
これ以外の情報ソースは見た事が無い、10×10は先手が有利では?と言うのは
聞いた事があるが。それ以上の事は知らない 8×8では勝てないって言うけど
実際変化なしのガチガチ仕様にしたら人間側も暗記対応で引き分けにならないか
まあ暗記ミスで負けるから「良くて引き分け」なんだろうけど 待ったありってことか。
無理じゃないかな。
人間が待ったの繰り返しで体力的にたどり着ける程度の探索木なら
コンピュータは全読みできね? いや待ったじゃなくて
高段者の中にはかなり広くドロー進行憶えてる人もいるわけじゃん
ソフトがガチガチ最善変化なしモードならそれを辿る可能性が高いから、
暗記手順を再現するだけで引き分けという戦績を得られるんじゃないかって話 ガチガチ最前変化なしモードを期待して一回負けた相手に分岐点まで再現させて新たな分岐に臨むのは実質待ったと同じだと言ってる
そしてそれでは勝てないんじゃということも ネットにある完全解析は、終盤42手が最高みたいだけど
それ以上やった人っているの? >>103
なんか話が合わない奴だな
>ガチガチ最前変化なしモードを期待して
最高レベルのオセロソフトであればまず考えられるのは変化なし、ドロー定石進行モード
期待どうこうの話じゃない
>一回負けた相手に分岐点まで再現させて新たな分岐に臨むのは
ここでもう意味が分からん。何で負けたのが前提?しかも負けたところから強制的に変化させると誰が言った?
勝手に待ったと同じ状況を後付けしておいてから、それ待ったと同じじゃね?って言われても困るのだが・・ 完全読みって言うと全てのパターンを数値化しなきゃいけないみたいな認識になってしまうけど
出回ってるソフトで見れば1手目から普通に評価値として分かるけどね
要は知りたいパターンをコンピュータに計算させればノートPCでも普通にその試合の完全な読みは出来る
ただ全てのパターンを求めようとするから膨大な数になるだけで実際は-??とか論外なパターンつまり計算しなくていいパターンまで計算するからこうなる
実際最近のソフトは最善1〜4つ以外を選択肢から外し計算もしないで高速化させてるってパターンが多いけどね
人間が解析目的でソフトを使う分にはもう完全解析と言っていいレベルまで来てると思う >>112
逆だ。
1手目から計算可能なのは、そこから20手程度を読んだ盤面の評価値であって
終局のスコアではない。30手近辺から最終読みしたら、恐らく1パターン計算する
のに1日程度はかかると思う。
実際のソフトは、ある程度先の時点から、終局までを読んだBOOKなるDBを持って
いるので、そこに至る過程でminMax探索すれば、初手の暫定的な終局予想を得る
事は可能だけど、たとえば30手目以後完全であっても、そこまでに分岐でそれより
良い手がある可能性は否定できない。 コンピュータオセロ総合スレッドが無くなって寂しい
もう5年くらいちょこちょこ自作ソフトいじってるけど
もう作ってる人もいなくなったのかなあ >>117
ナカーマ!
僕は自作って2年くらい。
Ver.2で完全読みの速度アップするつもりが、ダウンしてしまったorz
EDAXとかZebraとか探索ノード数の少なさが謎です。
評価関数とMPCのパラメータがなんか信用ならないので、全面的に
作り直そうとしたまま悶々としています。 >>118
評価関数の精度も重要だけど、偶奇理論や置換表のハッシュ値生成、pvnodeの選別やらがかなり重要みたい
そこら辺適当に実装してもFFO45が70秒台と全く近づけそうにないです… >>120
どもです。
偶奇理論って効くの?一回試したけど、全く効果なくて止めた事あるんだけど。
moveorderの並び替えで使うんだよね?
ハッシュ使う深さは所詮10+α程度までなので、キー生成はstd::unorderd_map
にお任せしてます(汗
今は、流行りのディープラーニングを評価関数に応用できないかとあがいています。
が、まだどうネットワークを組んだら良いのかわからず、誤差が使用可能なレベルに
収束してくれないまま、悶々と2か月ほど経過してしまいました。 >>122
偶奇は残り数マスのところで実装するだけでかなり効果があるはず
並び替える条件を高速に判定しないと探索速度にかなり影響与えるけど…
評価関数は普通に最急降下法で収束させから、ディープランニングについてはよく分からないなあ >>123
残り数マスだったら、むしろ、何もしないで極端に簡素な処理にした方が速く
なるんじゃないかなぁ。
自分は残り7マスからmoveorderingをしていません。更に残り5マスからは
着手可能位置(mobility)も使わずに空マスに着手してみてひっくり返る石
あったら着手できるとしてます。並び替えのロジックはそれらより浅い深さで
しか使いません。その代り、MPCなんかの枝刈系はしてます。
基本、浅いノードでは事前準備に時間かけてカットが効率よく働くようにして、
深いノードでは下のツリーはたいした量が無いことから、簡素化による処理
時間の短縮をメインに据えています。
って言いながらも、聞くとなんか試してみたくなっちゃうんだよなぁ。
>>121
プロファイラってなんだっけ?と思いながら検索したら、これは便利そうですね。
ちょっと使ってみたいけど、今はディープラーニングから脱線したくないなぁ。 >>124
偶奇理論を少なくとも4マス3マスの空きマスで適用しないと速くならないよ
Zebraやedaxもやってる
そちらのアプリはFFOベンチマークはどのくらいの速度あるのかな? >>124
あと残り数マスで合法手取得関数呼ばないのは一緒かな
偶奇理論実装してもNPSは落ちるがそれ以上にノード数削減できるから秒数が縮まる感じです >>125
FFOテスト全部はやってません。
ソース綺麗にしたら遅くなっちゃったバージョンですが、こんな感じです。
#40 0.516s
#41 3.463s
#42 4.173s
#43 11.763s
#44 5.623s
#45 80.594s
こんな感じです。元のバージョンは#40は0.3秒台後半が出ていたかな。
PPL(マイクロソフトの並列処理)で、並列化してますが、2コア4スレッドな環境
なので、あんまり効果は出ていません。
その他、mtd(f)、置換表、確定石数によるαカット他、いろいろやってます。
ディープラーニング終わったら、末端探索の偶奇理論を試してみます。
色々ありがとうございます。 失礼
>>124に間違いがありました。
完全探索なのでMPCみたいな前向き枝刈はしていませんね。 >>127
おお、大体同じくらいですね。
昔はとある棋譜から学習していたのですが、
白の得点が長らくおかしい&牛、鼠定石の棋譜が極端に少ないなどの理由から
自己対局による棋譜によって再学習させています。
今のところ50万局程度しか集まってなく、終盤の精度があまり良くないのですが、
FFOは以下な感じです。(FFO45がいつの間にか80秒超えてた・・)
FFO50と54の成績が悪いのは学習が進めば直るはず・・・
FFO#40 (a2:+38) 1.57sec FFO#41 (h4: +0) 3.97sec
FFO#42 (G2: +6) 5.19sec FFO#43 (G3:-12) 7.73sec
FFO#44 (D2:-14) 4.85sec FFO#45 (b2: +6) 80.02sec
FFO#46 (b3: -8) 14.40sec FFO#47 (G2: +4) 7.28sec
FFO#48 (F6:+28) 62.71sec FFO#49 (e1:+16) 97.49sec
FFO#50 (d8:+10) 480.67sec FFO#51 (E2: +6) 85.90sec
FFO#52 (a3:+0) 238.19sec FFO#53 (d8:-2) 1406.01sec
FFO#54 (c7:-2) 4452.97sec FFO#55 (B7:+0) 6308.43sec
FFO#56 (H5:+2) 515.11sec FFO#57 (a6:-10) 2245.01sec
FFO#58 (g1:+4) 1201.58sec FFO#59 (g8:+64) 0.62sec >>129
FFO43はG3ではなくC7ですね
まぁ両方とも同じなのですが、学習させるたびに手が変わったりします・・・ >>129
自分は300万棋譜計画ってのを使ってますが、バグってる棋譜が微妙に
混入しているので、テキスト形式の棋譜を読んだら、一旦自分に都合がよい
形式に変換して、その時に頭から全着手&スコア再計算してます。
棋譜データに関しては、残り20〜22手程度は完全読みできるけど、その手前
は最善着手ではなく、あるアプリが選んだ最良着手に過ぎないわけで。そこの
扱いで結構悩みます。
あと、評価値算出には使えませんが、Edaxあたりの引き分け手順(BOOK)データ
も、定石以外で使い道ないかなぁと夢想してます。あれも、何手目までランダム
なのかよくわからないですが。 >>131
どうやら同じ棋譜ですね…(^o^)
あの棋譜って定石に偏りがあったり、おっしゃる通りバグっててA1が連打されてたりする棋譜があったりでなかなか困り者です
自分はそれをベースに学習したあと、さらに自己対局で学習させてます
とりあえず300万集め終わるまで続けるつもりです >>132
やっぱりそうですね。
まあ、手軽に大量の棋譜が入手できるので、そうなりますよね。
趣味でやってるので、気にしないようにしてるのですが、他者の作ったPC対決の
棋譜を使うのって、オリジナリティーに問題あるし。そもそもEdaxのBOOKをそのまま
借りてたりするしで。
自分も、やりたい気持ちはあるのですが、仕事で持ち歩くノートPC1台しかないので、
何ともできません。引き分けBOOK構築用のプログラムも用意してあるのですが、
数年間動かしっぱなしにしないといけないので、テストだけして放置してあります。
24時間365日動かしておける専用のパソコンが2〜3台欲しい。 そういえば、今のバージョンはmtd(f)ですが、以前のバージョンは
軽く反復深化して、置換表にmoveorderingに使用する情報をセットして、
アスピレーションウィンドウサーチでやっていたかも。
頭がディープラーニングになっちゃったので、ボケボケな感じです(汗
その時が来たら戻すつもりです。 終盤のMPC探索はまだ実装していないですね
事前探索の得点からの平均と分散でいけるかな?
WZebraの95%とか99%とかはそういう意味かと思ったのですが、実際の実装はどうなってるんでしょうね〜
8月中旬あたりから本格的にやってみようかと思います。
自己対局・・・まだ80万局あたりです。。終わるのは9月末かな(涙) >>135
僕もそこは納得行く理解ができていません。
反復深化のように、MPCのカットスレッショルドを上げながら、
moveorderingに使用すると探索が速くなるんじゃないかと、
一回試してみたいのですが、事前探索の分だけ速度が落ちて
採用見送った事があったかも。
>自己対局・・・まだ80万局あたりです。。終わるのは9月末かな(涙)
なんだかんだ着実に進んでいるじゃないですか。
僕はディープラーニングを試す方向に逃げた結果、3か月たっても
未だに有効な方法が見つからずに迷走しちゃってます。
うらやましい。 >>136
ディープランニングを調べてみましたが、パーセプトロンみたいなニューラルネットワークの一種なんですね
棋譜に出てこなかった0点のパターンも予測するみたいですが、実装方法が自分にはさっぱり・・・
自己対局はバグの修正が大変で(特に終盤探索のPV-LINE生成に苦労)
完全に実装するまで2週間かかりましたw
orderingのパラメータ調整と5マス空きparity moveの実装
potentional movesのみのorderingを8〜6マス空きの時にしてみると大分ノードが削減できて
今FFO45が60秒台まで行けました。
あとは終盤MPC実装に賭けたいと思います。 86万局で学習させた時のFFOです(上記のorderingなどの調整込み)
なんかFFO48やFFO49など前より悪化してるものが・・・
事前探索の後にすぐ100%の終盤探索に入るのがだめっぽい(間違った手を最初に調べる確率が高くなるため)
やはりMPCありの終盤探索で手の精度上げないとまずそうです
FFO#40 (a2:+38) 1.36sec FFO#41 (h4: +0) 3.75sec
FFO#42 (G2: +6) 4.86sec FFO#43 (C7:-12) 6.33sec
FFO#44 (B8:-14) 9.46sec FFO#45 (b2: +6) 64.88sec
FFO#46 (b3: -8) 13.20sec FFO#47 (G2: +4) 5.66sec
FFO#48 (F6:+28) 67.74sec FFO#49 (e1:+16) 121.90sec
FFO#50 (d8:+10) 376.73sec FFO#51 (E2: +6) 86.08sec
FFO#52 (a3:+0) 132.61sec あと他にもオセロソフトを作っている方がいれば、それ用のスレを作りたい所ですが、
過去にコンピュータオセロ総合スレッドpart3を作りましたが、すぐ落ちてしまって・・・w ディープラーニングの欠点は、何をどうすれば良くなるのかがわからない点です(汗
今のところ、思いつきで構造をいじってトライアンドエラーしてますが、最初から方針決めて
虱潰ししていくべきだったと後悔中。あと、少なくとも学習するならハード投資が必要だったなと。
ちなみに、1層のパーセプトロンから活性化関数を外し(恒等変換)て、入力をロジステロ
の評価パターンにしてスコアで学習させると、そのまんま線形回帰の計算になります。
一方で、ディープラーニングでは、盤面情報をそのまま与えて、学習をさせます。すると、
うまくいけば階層構造の中にロジステロの評価パターンのようなものが、自然に形成されて、
Buroさんの評価関数よりもうちょっと恣意的じゃないものができそうという事です。
コンピュータの計算資源が限られているので、あまり深くて複雑な構造は厳しいし、また
評価関数として使うんなら、あまり計算に時間がかかるのは困るしで、どうしても多くても
4層くらいまでしか試す事ができず。今のところ1σが6前後までしかフィットしてくれません。
また、出力を64に分類する事で、次の1手候補を学習させる事もできるので、こちらも前向き
枝刈なんかに使えないかなぁと思いつつ、そもそもパターンが構築できていないので放置して
ます。
当初は自分で実装していましたが、畳み込みの計算の説明でいくら読んでもわからない所が
あったり、並列計算で高速化したかったけど面倒だったので、人さまが作ってくれたライブラリ
を拾ってきて、改造しながら使っています。
手を動かしながら、「画像解析系の技術って、もしかしてオセロとは相性が悪いのではないか?」
という疑問と、「少なくともBuroさんは、たったあれだけのパターンから正確な評価関数を作った
んだから、画像解析系の技術でできない事はないはず」という楽観の間で揺れ動いています。 >>138
終盤MPC進展があったら教えてください(汗
>>139
一応、プログラム板に
【オセロ,将棋】ボードゲーム【囲碁,War】
http://echo.2ch.net/test/read.cgi/gamedev/1057763418/
がありますね。こちらも閑散としていますが。
でも、いまどきオセロプログラム作ってる人自体が珍しいかも(笑) >>141
こんなスレがあったとは…ありがとうございます
今時は将棋か囲碁でオセロはブーム過ぎ去ってしまいましたね(涙 どもです。
ちなみに、あそこの>>310は僕です(汗 ■ このスレッドは過去ログ倉庫に格納されています