【俺たちの】Leela普及委員会【無料ソフト】Part.2
■ このスレッドは過去ログ倉庫に格納されています
ランダムにしたら当然自己学習じゃなくなるだろ
自分で定石に気づいてその定石を突き詰めていって変えるか変えないか欠陥があるかないか自分で判断するから自己学習なんじゃん
勝手に人間がこの定石とこの定石とって設定して学習させたら定石自体も自分で見つけてないじゃん >>322
何を言ってるんだ?
勝率が高い手を選ぶ事自体AIがそう判断してるからじゃん
それをランダムにするのはずっと同じ手順が繰り返されてより学習に時間がかかる欠陥を補うための措置だろう
候補手をランダムにする事と定石をランダムにするのは全く違うことじゃん >>326
あんたの言うとおりさ
方針変えちゃ駄目なのに 323
チグハグじゃないよ。320が言ってるランダム性は例えば三三決め打ちの
今の状態だと対策し易いから一定確率でカカリも選択するようにしようってことじゃん。
完全にzeroの趣旨に反してる。321の人が正しい。 やりたかったら自分でやれば良いよ
今のやり方でもそこそこ順調だし
完全に上がらなくなったらその時考えるでしょ >>323
alphaと同じ設定なのか?
余りにも同じ進行が続いていると思うんだが
>>324
何言ってるんだ?
誰も定石教えるなんて書いてないだろ
leelaが考えうる進行の中での話だって普通に考えて解れよ
>>326
お前こそ何言ってるんだ
alphagozeroだってデュアルネットワークで勝率計算させて高い手を選ばせてるだろ
>候補手をランダムにする事と定石をランダムにするのは全く違うことじゃん
定石選択をランダムにするのと候補手をランダムにするのは同じだろ
定石段階の候補手選択をランダムにって事なんだから
本当に何言ってるんだ
>>327
そもそも使うパソコンもネットワークも何もかも違うんだが
方針が同じなのは「ルールを教えるだけで人の棋譜や囲碁の情報を教えずに自己対局のみでどこまで強くできるか」ってとこだけだろ
そこ変えなければネットワーク増やそうが違うハード使かおうが関係ないのが現状
passだってalphagozeroと違う回数でpassさせてる
勝率による着手選択も投了のタイミングも効率が良いのを選ぶのは当たり前
>>329
ランダム性無いから対策されるとは書いたが対策されないためにランダム性持たせようとは書いてないだろ
そもそもalphaもランダム性持ってる >定石選択をランダムにするのと候補手をランダムにするのは同じだろ
>定石段階の候補手選択をランダムにって事なんだから
上と下が同じだと思ってる時点で相当やばい人な予感 定石選択ランダム
色々な定石の中からランダムで打つ行為
LZがどの定石を覚えているかどういう事を覚えているかなど開発者は知るよしもないので神にしかできない行為
なので特定の定石をこのように打ちなさいと人間が教えてランダムにする以外に方法はない
候補手のランダム
候補の手順のなかからランダムに選ぶ行為
初手から数手だけランダム
候補の手順のなかから初手から数手だけランダムに選ぶ行為
勝率が一定値以上の中からランダム
勝率の高い候補手のなかからランダムで選ぶ行為
LZが採用してるランダム お前の勝手な解釈だろ
誰がそんな定義づけしてんだよ頭大丈夫か
星打ちに対して三々に入るのもケイマにカカるのも定石選択であり候補手の選択
打ち手同士が相談するわけでもなく互いに最善を探して打つのが囲碁なんだから、三々を例にするなら三々打つまでが定石の選択でその後相手の追う手によってその都度定石を選択していって部分的に一段落して定石の終わりだろ
三々打つ時点で三々から二段バネの流れを選択出来るわけない
そんなの交互に打つという囲碁の基本中の基本でそれをわざわざ書いてあげないと理解できないキチガイはこんなとこに書き込むなよ こいつが何を言ってるのかさっぱり分からない
誰か解説してくれ なんか頭でっかちな意見だなあ
定石こそ誰かが勝手に定義した知識でしかないぞ
定石はあくまで部分的にいい加減な分かれであって、
必ずしも全局的に良いとは限らないし、
どこで一段落とするかも局面状況によるとしか言えない
「定石を覚えて二子弱くなり」って格言は当然ご存知の筈だな?
そもそもLeelaZeroは定石なんて概念は持っていなくて、
勝ちやすい形や手順を学んで、それが偶々人間が知る所の"定石"になっただけなんだよ
"定石を選択"なんて全くしていない >>338
お前が定石の選択=定石の終わりまでの手順を選択と思い込んでたキチガイということで終わり >>339
お前の書き込みこそ頭でっかちだと気付けよ無能
leelazeroもalphazeroも学習で効果的と思われる部分的な分かれを何度も繰り返して選択してるんだからそれがそいつらにとっての定石だろ
なんでこんなに頭悪いのしかいないんだ 何を発狂してるのかも分からないし何を言ってるのかもマジで分からない
これが糖質ってやつ? 何度も言うけどソフトは"定石"なんて打ってないよ
局面という入力を受けて次の一手という出力を返しているだけだ
それと自分が正しい事言ってるつもりならまず言葉遣いには気をつけた方がいい >>341
とりあえず小学校行き直してこい
話はそれからだ 定石は局面における思考の簡略化だからね
ソフトでも定石設定があると当てはまる局面では思考しないで済むし
Zeroの場合は定石なんて知らないだろけど
話は変わるけど、もう更新されたがe9c2は対AQにはなかなか勝率良かった
更新されたらので中止するけど、50局時点で32-18(5秒 GTX980ti)で結構勝ち越してた >>342>>344
反論出来なくなった馬鹿の末路
>>343
だからその中で同じ手順を繰り返して使ってるんだからそれを定石っていうんだろ
alphaの話でも普通に新定石として扱われてる
その繰り返してる有効なを人間同士が意思疎通するために定石と呼ぶだけでAIが定石という言葉で定義してるわけがない
お前がやってるのは揚げ足とろうとして頭悪いのを露呈してるだけ
それからお前らみたいに頭悪いのを相手にするのに言葉遣いなんて気をつける意味ない 反論出来なくなったも何も勝手に発狂しちゃって意味不明なこと言いだしたら病院紹介するくらいしかできないんだが
君はまず論理とか集合とか数学の知識を付けてからコンピュータのスレに来た方が良い ああ、更に言えば"選択"もしていない
評価関数と探索アルゴリズムに従って近似解を計算しているに過ぎない 簡単な流れ
>>333
>>335
>>336
>>337 意味が分からない 誰か解説して
>>338
>>340 意味が分からない 誰か解説して
分かる人解説よろしく たぶん論理とか集合が理解できないで発狂してる感じはしてるんだが
言ってることがよく分からない こんな頭悪い奴らが囲碁やってるのか
人集まらないわけだ leelaが人為的なランダムを選ぶようになるから失望したんだろ?このスレ見ない方が精神的にいいんじゃないか? >>349
どんだけ頭悪いのか
近似解を出した後それを着手として選択しなかったら手が進まないんだが こいつ入力・演算・出力も知らんでご高説宣ってたのかw Cross-table of results for Lz-V3-12t4g
Rated: 3840?
as of 2018-03-30 14:01:49
Opponent Rating Result Percent
Perseus-8 3774 2 / 2 100.00
Zen-15.9-1c1g 3693 2 / 2 100.00
JingSiWeiqi 3501 2 / 2 100.00
LZ-e9c2-gtx1080 3419 2 / 2 100.00
Zen-15.7p-1c1g 3417 4 / 4 100.00
leela-0.11.0-p1600 2978 2 / 2 100.00
LeelaZeroGO 2954 0 / 1 0.00
mygo 2930 1 / 1 100.00
Emily_180330 2824 1 / 1 100.00
rgzn_v2_39 2795 1 / 1 100.00
Maru-3.1.2-0g 2682 1 / 1 100.00
Aya793d_524_ro_2k 2648 1 / 1 100.00 >>358
20gamesで止めててわろた
awsかなんかかな まあ4SLIとか
たぶんそうだろう
マルチにすれば強くなるってわかったのは収穫だけど
まだグラボは高い
1070ぐらいでやって見るかな alphazeroは初めから40x256のクソ重いネットワークで自己対局してるから結果的に同じplayout1600でも棋譜の質が最初から高かったんじゃない? 普通のPCで使うネットワークの重さはどの位が丁度良いのだろうかな
で、ZeroはGPU無しでも同じ位の時間消費の天頂9段に普通に勝ち越せる
ホントに強くなってると感じた スペックアップとプレイアウト増やせばシチョウも読めるのかな シチョウは本当にプレイアウト次第
>>364
せいぜい128x6か128x10ぐらいと思うが天頂7はどうなってるんだろうな 最近あったクソ重ネットワークのテストでは
960で一手12秒程度だったから実用では厳しそう でかいネットワークだと対局用の2エンジンがgpuメモリに乗り切らなかったりするんだろうか UCT探索は40万プレイアウトくらいで棋力がサチるどこかで見た気がする
1手1分でそれくらいプレイアウトできるネットワークサイズが適正かな 128x10対256x20を同時間でテストした人によると
256x20の勝率は
GTX 670
1手2秒 11%
1手5秒 19%
1080Ti
1手2秒 25%
1手5秒 41%
1手1分とか、TensorCoreに対応してTitan Vでぶん回すとかすれば同時間でも上回る可能性が高い
棋譜生成には向かない シチョウは敗勢の水平線効果で逃げ出してるのがかなりある 256x20は学習局面が少ない(数世代遅れてる)から
同じ学習局面数のネット同士で比べたら大差で256x20が良いかも 20×256であまり実用的じゃないから次は少し下になるかもね
有るのか分からないが10×192とか15×128とか
とても40×256なんて無理な話 >>371
それは20x256のプレイアウトが極端に少ないことによって結果が歪んで出てる可能性があると思うぞ プレイアウト数はどの程度有れば実力をだせるのだろうか
必要な数が分かれば GPUの性能と思考時間からネットもサイズも出て来るな
一般的なPCだと大きくし過ぎても使いこなせないね 俺はいつも20秒50万
時間で切ってるんだからいくらでも増やせるだろ 2秒で1万が限界のラインだろう
これを下回るようじゃ今のGPUじゃ実用的じゃない 2年おき位に出るから
4年後3080TIで20blockが標準
8年後5080TIで40blockが標準って感じになりそう
それ位に20×256と40×256は重い
Titan買えるなら1年早まる Leela11で20秒25万くらい行くで
1080 autogtpでselfplayさせると序盤で変な位置に着手する時あるけどこれ正常なの? パンダのLZが10段星2つまで上がったな
最高位まで後星2つ 耳垢の中の人が実はalphazeroはシチョウを読めないままでzeroの方式ではシチョウを理解できないとかいってるな そんな当たり前のこと言ってもな
それに読める読めないってのはPO1万以内とかで話してるんであって100万とかじゃないし
何処まで時間をかけるかとか、何手のシチョウかで大きく変わるしどうでもいい話なんだよ 学習の最終盤でシチョウ理解したとDeepmindの論文には書いてたが
そのお方はネイチャー誌に出す論文が嘘書いてると主張なさるのか? 嘘とまでいってないが疑ってるな
シチョウ用の工夫をしてるmasterでさえシチョウから逃げてるのにzero分かってるのかと >>389
その人、AZ論文見ても将棋やチェスでのニューラルネットの構造分からなかったとか言ってるけど
論文にAGZと同じと書いてある、その程度しか見てないよ。 CGOSが全然機能してないな
強いAIは勝ち逃げしちゃってもういないし弱いのはスペック次第になってるし
PO3200固定で新しいの作って欲しいな
固定なら沢山の人がLZ動かす意味もないし電気代も全然かからないし
技術のみ競えるだろう CPUは1Cか1T固定
グラボはSLIの場合はシングルバージョンも合わせてテストを義務付け
PO3200固定
スペック公開(グラボはチップセット、CPUは型番)
100ゲーム以下同士のテスト禁止
ぐらいやらないと無法地帯で
ブラックボックスが多過ぎて比較できない そこまですると誰でもオープンにつなげるところではなくなってしまいそうだ
今の状態が良しとは思わないが Zenの自己申告のスペックも信用ならないし 可能な限り基準は合わせないとな
規定演技とフリー演技をごちゃまぜで評価するようなもんだ
テストプレイヤーのオナニー見せられても面白くもなんともない ぎりぎりパス
220 : 180 (55.00%) 設定とスペックを例え自己申告でもガラス張りにすれば
似たスペックなのに明らかに勝率に偏りがあると嘘ついてるとバレるからな まあ開発者の方々からしたら普通はゲタ履かせる理由はないが
変なところで負けず嫌いな方もいらっしゃるかもしれないからな… 白番もそろそろ三々入られた後の二段バネ止めるかも
一路外す手の価値が高くなってきた 256*20は重くて使えないな
1080ti3つくらい用意すれば10秒以内で使えるの品質になるのかね?
1つじゃ全く使えない
128*10で沢山早く読んだ方が強い いや10秒で使えるPO数(3万〜5万)になってもらわないと厳しい
1080tiで今は30秒以上かかる 以前にも話題になったが、
256*20が30秒考えるのは良いが、だったら128*10も30秒考えさせて対局させないと意味ない。
まぁ学習を重ねれば256*20の方が強くなるんだろうが。 同じ時間じゃなくて同じプレイアウト数にしないと駄目じゃないの? 128x10は大石のアタリを見逃すことあるけど
256x20は見えてる
同じ棋譜学習してここまで違うとは驚き、
1ドットの差を見分けるにはこれぐらいの規模が必要か 条件が公平ならPOが多ければLZは256使えば勝つだろうし、少ければ128使わないと無理だろうな
そういう細かいところ分かってやるなら意味があるけどグーグルのZEROの時みたいに都合よくやるなら時間の無駄だと思う 100GAMEくらいまで行かないとなんとも言えないが
AQと同等くらいはありそうだ ■ このスレッドは過去ログ倉庫に格納されています