X



人工無脳
■ このスレッドは過去ログ倉庫に格納されています
00011
垢版 |
02/05/07 05:55ID:JxGSPxBK
いい人工無脳ありませんか?
0161nobodyさん
垢版 |
04/09/03 17:10ID:???
物凄くつたないperlで、WEBサイト取り込んでURL抽出して、おおよその自然文に整理して、
それを茶筅で品詞分解して(mechabuでのperl利用は挫折)それぞれの品詞に副詞の候補
つけて、出現回数で評価付けして辞書にするあたりまで出来た。

この段階で難解バカボン並の駄文を連発する事は可能(手動登録での駄文生成は以前やった)。
これに各品詞への別品詞の関連も要素に含めて、茶筅分解時の品詞の並びから自然文構造
辞書作って並べれば、ある程度の文章にはなるんじゃないかと思ってる。

1つのWEBページ分解したら、あらたに分解する以上のURL増えたり、やはり2chが多く引っかかった
りするのが面白いw
0162161
垢版 |
04/09/25 22:59:31ID:???
家鯖設置の友人メインのサイトでゴリゴリと無脳?にWEBよ読ませて毎日駄文書かせてる。
かなりつたないコードなので負荷がかなり高く、あまりレンタルサーバーのような所に設置できる
代物じゃなくなってしまった。

一応、某MMOのデータベース的サイトのトップに、お遊びで派生版を設置してみた。
XREAなのでシステムが機動されるペースを調整しながらだけど、結構な負荷で怖い。
そちらは、扱ってるゲームの手動で指定した日記サイトを巡回して新規項目を取り込み、
同じく茶筅で解析後辞書として保持、簡単な一文をキャラクターの台詞として表示。

まったく前後脈絡無く品詞を並べる訳ではなく、それなりに関連性のある単語と助詞を
組み合わせて作文させてるので、変な日本語ではあるがそれなりに読める。

マルコフ連鎖を使うと、もっとそれっぽい文になると思うけど、辞書へかなりの量のサンプル文を
取り込まないと、原文に近くなりすぎるんじゃないかと思っている。
で、活用形とかではなく助詞をバリエーションとして羅列しているんで、500KB程度の辞書
でも相当な負荷に… XREAのは100KB越えると出現度低い方から消している。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況