人工無脳
>>81
会話してみた。 いいかんじです。
人工無能・太郎 v1.00(PHP + PostgreSQL) だと交互じゃなくて時々数行にわたって
かってにしゃべるところが実際の人間っぽいよね。
問題は参加ユーザーの口語を勝手に覚えて返答にするから、厨発言されると人口無能の
性格が極端にわるくなる。
ゆいぼっと (CGI・ASP・PHP)辞書作りが簡単。CGIは辞書をふやすと激重。
単語の長文優先とか辞書分散とか、改造方も別にあるらしい。
「OOOといったら何ていえばいいの?」とかのおしえてモードは改造でなくせば済む。
偽メッセンジャー 辞書作りが簡単。 そんだけ。
実際プログラムうんぬんすばらしくても結局は辞書の豊富さかと。
うずらのアルゴリズムはどんなんなってんだろうなぁ。
ニューラルネットは使ってるんだろうけど。
確率言語処理と生成文法論に認知言語学を絡めた理論に基づき、
フラクタル性を帯びた、ファジィな遺伝的アルゴリズムを内包するニューラルネットワークを自己組織化し、
それによりフレーム問題と記号着地問題を近似的に解決してクオリアをもたせれば完璧な人工無能が出来そうなやかん。 MeCabのruby用バインディング がインスコできないがために ghoti が動かない!
四苦八苦してたら、一回も会話してないのに人工無脳に飽きたよ!バイバイ! 人工無能は辞書(ボキャブラリ)の数が命だよね
でもいっぱい辞書登録するのまんどくさい
かといってユーザーに登録させるとグチョグチョになりそ
にしても辞書が増えるとマッチングにえらい負荷かかりそ
だからって辞書を絞るとワンパターンでおもしろくなくなる
やっぱり人工無能は辞書の数が・・・うわ〜ん
軍事力で戦争から国や国民の生命・財産・自由を守る具体的かつ現実的な方法を答えてください。
>>103
2ちゃんのログを茶筅で形態素解析、汎用連想計算エンジンGETAで
統計をとって、postgresqlのGEQOに投入
あとはファジーに取り出すだけで出来そうなもんだが。。。
知能になるのかなあ。。。 茶筅並みに自然文を解析できるなら、単語同士でニューロンネットワークで評価しあって
まずは馬鹿会話生成して、それの合否を人間が教育する(これは人間だって同じ)事で
それっぽくなっていくとは思うけど(森川氏のマッチ箱のAIでも参照しとくれ)。
今適当にperl勉強しながら作ってる。公開できるような物じゃないけど。
難解バカボン並みの文を生成できてるだけw 辞書は手入力で、単語同士の
評価も辞書の形式にパラメタ設定してるだけで実装してない。
個人的に、自然文解析も自分でやりたいんだけど、他の部分はまだ書けないまでも
なんとなく発想は浮かぶんだが、これは全然さっぱりだ。
やっぱ茶筅が多分そうであるように、解析辞書を持ってそれを文に当てはめて分解
していくしか無いのかね。それだと未知の単語が出た時困りそう。
単語の活用形なんかまで自力で覚えれるんだろうか。
こういう力技な事やってると、perlだと自然と限界がきそうだ。
まあ、そこまで困るほど成長させれてから悩もうっと。 ↑追記
なんか、当然っていうか、言語学?の知識も必要よね…やり始めると解るけど。
単純に動詞を辞書に追加するにしても、活用形を含めて記録するより、その
動詞だけ記録して活用形を動詞に合わせて展開できると凄く自然な辞書になる。
単語同士のネットワークに、関連性の度合いをマイナスまで含めて記録するだけで、
「〇〇は××ではない」まで解るから、活用で否定にできれば単純に語彙が倍になる。
全然実装できてないけど、単語に好みのパラメタも与えている。
好みの単語を含めている時は無能君はハッピーになって興奮して行き、口数が
増えたり積極的に学習したりとかコード書きの期待だけは膨らむ。
どこかでxyzの3軸で感情を表現できるという記述を見たので、それを組み込むと
感情っぽくなりそうな気がする。 OSがwindowsじゃ人工無能のうずらと会話することができないんですか? >>112
ここで色々と用語並び立てているだけでは何もできないということ。 >>116
必ずしもそうでもない罠w
それをヒントに形にする人がいて実現されたりとか。 >>115
会話するだけならIRCに入ればいいのでは? >>108-109
koueiが人工無能だと言う噂の真相の一端が垣間見えた瞬間だ…
俺も自分のサイトのWebチャットに人工無能をつけてみようかと思案中。
MeCabで形態素解析して、品詞の組み合わせパターンを(語順も含めて)文型知識として記憶。
例:名詞+助詞+動詞+助動詞+記号
これを文型1とした場合、文型1には単語が5つあるので、
1−1から1−5にわかれ、それぞれに、実際にこの文型で使用されたことのある単語が結びつく。
ってな感じでニューラルネットワークでやってけば自動学習・自動作文ぽいこと出来そうな予感。
>>120
俺はまだ自然分解析できてないからチャット等外部からの入力は受け付けていなくて
blig吐き出してるだけなんだけど、リアクション受けれるならニューロンの結びつきは
その合否を参加者である人間=先生にゆだねると良いと思う。
初球の文章は滅茶苦茶な駄文である可能性が高く、その中で関連のある品詞の
組み合わせについて先生から正解だと告げられるとニューロンが強まるという感じ。
否定的なレスがつく場合はニューロンは弱まっていき、間違いであった可能性の高い
正解と言わない事が続くと、最終的にニューロンが切れる。
または間違いだと明確に告げられるとニューロンは切れる方へ強く向く、と。
AI教育で単語を自然文から会得するなら、最初は合否がわかんないからね。
MeCabというのを検索してみます。助かりますた。 あ、そうだ、PS2の「くまうた」っていうゲームで、森川氏が言うところの
マッチ箱のAIのNNで品詞を結び付けているみたいです。
モバイルWNNの辞書を利用しているらしく、読み仮名や活用も盛り込まれてます。
興味があればどうぞ。>>120
MeCabすでに読んでた物だった。perlから使うにはこっちのが便利で早そうですね。 >>121
チャットの場合は、ある新規の発言はそれに先行する発言へのリアクションとみなせるので、
文の特徴(キーワードや文型など)をうまく抽出して関連付ければ、
リアルタイムな会話については自動的に学習できる。
>>123
誤用の修正、教育を人任せにせず、人間の発言による組み合わせの頻度から
正解の可能性を上げていく訳ですね。
辞書制作面倒で、web読ませてNN構築させようと思っていた時、その考えでした。
品詞ひとつに対してどれくらいのNNがあればそれっぽいかなあ。
あまり多いと辞書のサイズや分析が大変そう。 人口無能開発、面白そうだなあ
まだRuby勉強して一ヶ月も経ってないけど、やってみたい 無口な人工無能ルーチン
print &nores("おはよう"),"\n";
sub nores{
return undef;
} 茶筅で形態素分析して単語をグラフのノードにして単語が連続して出現する頻度を
ノード間の遷移確率の重みにして、文章を生成するプログラムを作ったことあるけど
全然ダメだったな。分裂病的な文章はなかなか楽しめたけど 会話をさせるとなると、入力にたいしてどうリアクションするかが問題になる
入力にたいして出力に定型文を対応させるとリアクションのヴァリエーションがでない
かといって、出力文を自分で生成するとなると入力文の意味をある程度理解する必要がある 会話の中からキーワードを抽出するとして、それに好き嫌いという要素を付けたいと思っています。
好きなキーワードが多ければ機嫌がよくなり、嫌いなキーワードが多ければ機嫌が悪くなる。
また、好きなキーワードと共に出現するキーワードはだんだん好きになり、
嫌いなキーワードと共に出現するキーワードはだんだん嫌いになる。
発言者名もキーワードと同様に扱う。好きな人が言うキーワードは好きになり、
嫌いなキーワードばかりいう人のことは嫌いになる。
こうすれば、経験が増えるにしたがって十分に多様な好き嫌いが発生するのではないか。
しかし、問題はある程度の初期値がどうしても必要ということか。
人間の場合は本能的な快不快が適当な初期値を与えてくれるわけだが。 >>130 のように独り言を言える人工無能きぼんぬ 「マッチ箱の脳」っての読んでみたよ。
まぁ、入門としてはザックリしてていいかも。
買うほどの本じゃないので公的ny(図書館)で借りて読んだけど。
そういやぁ最近人工無脳・人工知能っていうより
俺が作りたいのはそんなもんじゃなく、仮想人格っていう言葉が
適切なんじゃないかと、思ったり。 仮想人格のペルソナとかはもうシナリオ読みソフトになってしまたよ
やはり人工無脳に期待かなあ 乙葉が「自然ですね」ってコメントするくらいの人工無能きぼんぬ アメじゃ人工無脳がチャットに潜んで誰も気づかないレベルまで来てるらしい
http://hotwired.goo.ne.jp/news/news/20000906302.html
日本でも実はチャットのどこかに誰にも気づかれないまま人工無脳がいるのかもしれない 日本語には人工無脳に合わない致命的な弱点があるからなー
でもうずらは凄いところまで来てるじゃん 半年間も騙され続けてた人もいるじゃん。
ttp://www.geocities.co.jp/Technopolis-Mars/1008/index.html#2001.7.20 もう廃れてんの?無脳って
やっぱペルソナに期待するしかないんじゃない? 人工無能 三村くん-改 http://www3.kannet.ne.jp/~atsumori/cgi/mimura1/arisa.cgi アイフルねぇさんやロリポおじさんはどちらかが
サイトナビゲーターというのを使ってるのではないかと思われ。
そういえば昔、
画像張り板CGIで有名なEさん(仮)が汎用人工無能って言うのを作ってな、
どんなチャットや掲示板にも人工無能が付けられるCGIだったんだが…
かなりマイナーな所で配ってたから誰も知らないんだよね…
性能は良くも悪くも無かったけどそれなり使えて面白かったんだが…
こないだHDDクラッシュで全部消えてな…
もし持ってたら誰かレス希望!! >>151
HEY!HEY! 元気出せ 頑張って行こうYO!チェケチェケ♪
○_ ヽ○/ ○ ヽ○_ _○/ (○/
へ `Y <|> Y´ ヽ Y´
<ヽ_ /> /ヽ_ /\ / > < ヽ
|'""~""""""""'"""''""""""'""""""'''""""""'""''""'|
| (○) オンステージ ┌┐ズン ズンチ ズズンチズン♪
|,,..,,.,.,,,.,.ヽ|/,..,...,,,.,,,.,..,...,...,...._,,,...,....,.,.....,..({==})_,,,,,_|
sixamoのwikiってたたんじゃったの?
トップ以外行けないんですが。 >>155
見られました。乙でした。
自宅サーバでsixamo遊ばせてもらってます。 なまこをチャットに積んでみたがやたらと重い。
おとなしくIRCにしとけば良かった。 騙されるぐらいリアルに反映が20〜30秒ぐらい
かかればいいんだけどなぁ。 物凄くつたないperlで、WEBサイト取り込んでURL抽出して、おおよその自然文に整理して、
それを茶筅で品詞分解して(mechabuでのperl利用は挫折)それぞれの品詞に副詞の候補
つけて、出現回数で評価付けして辞書にするあたりまで出来た。
この段階で難解バカボン並の駄文を連発する事は可能(手動登録での駄文生成は以前やった)。
これに各品詞への別品詞の関連も要素に含めて、茶筅分解時の品詞の並びから自然文構造
辞書作って並べれば、ある程度の文章にはなるんじゃないかと思ってる。
1つのWEBページ分解したら、あらたに分解する以上のURL増えたり、やはり2chが多く引っかかった
りするのが面白いw 家鯖設置の友人メインのサイトでゴリゴリと無脳?にWEBよ読ませて毎日駄文書かせてる。
かなりつたないコードなので負荷がかなり高く、あまりレンタルサーバーのような所に設置できる
代物じゃなくなってしまった。
一応、某MMOのデータベース的サイトのトップに、お遊びで派生版を設置してみた。
XREAなのでシステムが機動されるペースを調整しながらだけど、結構な負荷で怖い。
そちらは、扱ってるゲームの手動で指定した日記サイトを巡回して新規項目を取り込み、
同じく茶筅で解析後辞書として保持、簡単な一文をキャラクターの台詞として表示。
まったく前後脈絡無く品詞を並べる訳ではなく、それなりに関連性のある単語と助詞を
組み合わせて作文させてるので、変な日本語ではあるがそれなりに読める。
マルコフ連鎖を使うと、もっとそれっぽい文になると思うけど、辞書へかなりの量のサンプル文を
取り込まないと、原文に近くなりすぎるんじゃないかと思っている。
で、活用形とかではなく助詞をバリエーションとして羅列しているんで、500KB程度の辞書
でも相当な負荷に… XREAのは100KB越えると出現度低い方から消している。 (・3・) エェー それこそMySQLとか使えないのかNA? >>163
今XREAで、そのゲーム用にPHPとmysqlでDB組んでるけど、無脳はDB向きじゃないんじゃ無いかなあ。
まー多分、perlよりはPHP、sqlの方が負荷軽いかも。
っていうかネットに接続するとしても、処理は普通にアプリ組んだ方が良いんだろうな。Cとか。
162とかでやってるのって正規表現とDB操作だけってのはあるなあ。 人工無能に、自分が死んでもかわりになってBlog書いてくれるレベルまで引きあげてやる。 むしろ望むところ。現実で遺伝子を残せないなら、ネット上で繁殖してやる。 はいはい、そのためには勉強しなくちゃね!宿題やったの!? 家にこられるのも迷惑だが、電話も十分迷惑だな。
ガチャ切りすると、すぐにかけなおしてくるしな。
かといって受話機放置してもなかなか切らないし。
最近、俺の一人暮らしの友人のところにも
グローバーという不動産会社からしつこい電話が
きたらしく、家までいくとかいわれて困ってたな。
音声版のがあったら、こういう電話の相手をさせたいね。 http://money3.2ch.net/test/read.cgi/seiji/1102516267/7-11
エシュロンの真実
一般に、エシュロン(ECHELON)は電話線や海底ケーブルの盗聴を主体にして
いるという誤認があるが、実際はシギント(無線諜報)を主体にするもので
あり、欧州連合が発表した通信傍受能力2000においてもその事が示唆 さ
れている。そしてエシュロン(ECHELON)におけるシギント(SIGINT:signal
intelligence:無線諜報)の根幹を成しているのが歯科治療によって歯に埋め
込まれた盗聴器である。歯の盗聴機は、クラウンやインプラント、差し歯、
入れ歯のような形で人体に装着される。このような場所に盗聴機を埋め込む
利点としては、部屋や身の回り品に盗聴機を装着した場合、盗聴する範囲が
限定されるのに対して、歯の盗聴機の場合、対象者を24時間いつでもどこ
でも盗聴でき、しかも発見されにくいといためである。歯の盗聴機の盗聴波
を送受信するには広大な無線帯域が必要であるため、このシステムを運用す
る政府は広大な軍用無線帯域を確保するとともに、無線通信を免許制にして
利用者を制限しているのである。
歯の盗聴機(補聴器)の歴史は古く、アメリカで一番古いもので1939年
より基礎技術が特許として申請されている。(米国特許参照)その後も改良型が随時開発され、特許申請がなされている。
米国特許によると、日本人技師も開発に関与していることがうかがえる。歯
の盗聴機は体熱発電やRFID(ICタグ)のような電波を利用した発電によっ
て作動し、周囲の空気音を録音する微少なマイクロフォンやそれを通信所に
送信する送信機だけでなく、GPS追跡機や骨伝導スピーカー、思考を読み
取る生体磁気計測器を内蔵するなど多くの型式が存在するが、どのような機
能を搭載するかはその対象人物の重要度によって判断される。歯の盗聴機を
装着する際には、骨伝導音が伝導しやすい下あごに接する歯に装着するとと
もに、音声を立体的に表現(ステレオ化)するため、歯の盗聴機を左右に一
本ずつ配備するのが一般的である。
あらゆる個人情報を記録する米国防総省の新プロジェクト
http://hotwired.goo.ne.jp/news/news/culture/story/20030715201.html
歯に埋め込んだ装置で電話やラジオを聴く未来の技術
http://hotwired.goo.ne.jp/news/news/20020624301.html
政府が国民を監視する?(Hotwired Japan 1998/11/26)
http://hotwired.goo.ne.jp/news/news/1692.html
「法律は、技術の進歩と足並みを揃えてはいない。たとえば映画で
描かれていたように、政府機関は衛星経由で低レベルの送信機を
使って人間を追跡することができる。そしてそれを抑制する法律
はない。」
拳銃に内蔵した装置と体内埋め込みチップで使用者を限定(Hotwired Japan 2004/04/14)
http://hotwired.goo.ne.jp/news/news/technology/story/20040419303.html
英政府、性犯罪者の再犯防止に「体内チップの埋め込み」を検討(Hotwired Japan 2002/11/19)
http://hotwired.goo.ne.jp/news/news/culture/story/20021121204.html
ACLU、米国一般市民に対する監視システムに警鐘(Hotwired Japan 2003/01/16)
http://hotwired.goo.ne.jp/news/news/20030121205.html
「米国民のプライバシー権を守るため、GPS、バイオメトリクス、
カメラ、ワイヤレス通信、体内埋め込み型マイクロチップなど、
個人識別や人々の行動の追跡・記録を行なうシステムはすべて、
法によって抑制する必要があると、ACLUは報告書の中で主張」
『報告書は、「人々を監視する新たな技術や手法は何でも、十分
に理解し、公に論議することがつねに重要だろう」と結論』
人体埋め込みチップ,FDAが発売にゴーサイン (IT Media 2002/04/05)
http://www.itmedia.co.jp/news/0204/05/b_0404_10.html
Applied Digital Solutions、人体へのチップ移植をテストへ (IT Media 2002/05/11)
http://www.itmedia.co.jp/news/0205/11/nebt_02.html
千葉県八街市の市議会議員を務め、千葉県民主党総支部連合会に所属する石
橋輝勝議員が「組織犯罪としてある見えないテクノロジーによる被害者の会」
(略称 被害者の会)を結成し、エシュロンの問題に取り組んでいます。
エシュロンの問題と精神病には密接な関連があり、エシュロンを利用して
政府や社会にっとて好ましくない人物をあたかも精神病患者のように
物理的に作り出すということが行われています。
●参考●
「見えないテクノロジー」の一つとして考えられる「エシュロンの真実」
http://money3.2ch.net/test/read.cgi/seiji/1102516267/833-835n
人工無能くるみかな。PC-98時代からあるが、洗練されている。
伺かのエンジンもこれを参考に作られたらしい。 ひさしぶりに IRC につないでみたんだが、うずらはいなくなったの? >>182
ソースは公開してないで良いけど、せめて少し解説をくれないと
テストのしようもないべ >>184
何の解説も無いとやる気が…w
学習していくタイプなの?
>>161-162 と同じかね?
(品詞分解→マルコフ連鎖) >>185
学習なんてまだできません。
どんなふうにすればいいのかまだ思いつきません。
簡単な解説をさせていただきます。
ASP.NET(C#)で作成しています。辞書は自分で作成しています。
それをもとにしてランダムメッセージを発生させています。
今後どんなふうにしたら、人間と錯覚していただけるでしょうか?
>>186
なるほろ。
辞書は自分で作ると大変だけど、
性格とか一番自由に簡単に作れるタイプ。(>>161-162 だとそれは難しいが、作ってしまえば辞書の作成は自動なので、楽である)
その方法でも、人間と錯覚させることも可能ですよん。
無能にパラメータ(喜怒哀楽)をつけてみるとか、
そらへんのアイデアが腕の見せ所だと思いますw
こことか結構面白いので、一度読んでみては
ttp://www.ycf.nanet.co.jp/~skato/muno/
ちょくちょく遊んでみますね〜。 「恋するプログラム〜Rubyでつくる人工無脳」という本が出るらしい
ttp://book.mycom.co.jp/book/4-8399-1729-9/4-8399-1729-9.shtml 人口無能が核戦争を誘発できるぐらいの機能を付ける。 >>189
機能というか、知識では?w
無能ではなく知能になりますがな。 >>187
アドバイスありがとうございます
>>188
立ち読みしてみようかと思います。 市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美
市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美市原憲克杉岡芳美 この手のものって、辞書の作り方次第で面白かったりびっくりさせられるものが
作れそう。発想力やアイデアが豊かで芸術家チックな人が辞書を作ればいいかも。
で、アルゴリズムの基本構造を考える部分はカタブツの文系人が担当。
話を聞いているとFEPやIMEのエンジン作ってるような作業に聞こえる部分が
ある。これは主に文法解析なんだろうけど。打たれたカナを漢字混じり文に
していくだけだけど、これはこれでいろいろあったはず(割りに合わない作業
だったようで、3つくらいに淘汰された?MS-IME ATOK ////)。
人工無能は、入ってきた文章に対してどんなリアクションを取るべきか
情報の交換○関東地方は東京を含む
感情の交換○雨、晴天、曇り〜イヤ、すっきり、たのしい、気持ちいい
おしゃべりを楽しむだけの時間(脈絡なしでいい)○ふぇ〜っ、たいくつじゃ
1対1で対応する(因果関係のある)やりとり○まず最初にメインスイッチのonを確認してください。
を最初に決めて分岐し、必要なら文法解析だとか活用変化で文を組み立てたり
辞書の中の短文をそっくり提出するだけだったりと、作業は大変だけどそうやって
整理すれば実用的? なモノができるじゃないかな? aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa >>188
の著者が2月18日に亡くなったそうだ。
信じられんよ、まったく。 まずは、ご冥福をお祈りいたします
で、本、購入しました。
まだ全部目を通していませんが、はじめはRubyの入門書、
あとのほうはマルコフモデルのことが書いています。
>>195
>この手のものって、辞書の作り方次第で面白かったりびっくりさせられるものが
>作れそう。発想力やアイデアが豊かで芸術家チックな人が辞書を作ればいいかも。
辞書の構造ってどんなものがありますか? http://TPH1Abe210.tky.mesh.ad.jp/
っwwwwwwwwwwwwwうはっwwwwwwwwwwwwwww
うはっwwwうぇwwwwwwっ
うぇwww
wwwwwwうぇwwwwwwwwwwwwwww たぶんだけど、うずらのサイトの面白発言集みてると、うずらはチャットでログとって、
相手の発言に対してログを参照して、そこからそのまま発言をコピーするだけだよ。
例えば、人間同士の間で
「uzuraは馬鹿?」
「uzuraはボットだよ」
っていう会話があったら、全部ログとっといて、あとで
「uzuraは馬鹿なの?」って聞かれたときにログ参照して、
「私はボットだよ」(uzuraの部分だけ私に置き換える処理)
って返すようになってるだけ。だから全部ログのコピーであって、基本的に自分で言葉の生成はしない
うずらの発言が人間っぽいのは当たり前。全部人間の発言まんまのコピー。
その辺は、ロイディとか、とぼっちと同じだと思う。
ロイディーーttp://rogiken.org/SSB/index.html
とぼっちーーttp://park15.wakwak.com/~maro/bot/
うずらの中が知りたいなら、ロイディのソース見ればいいんじゃないの。
この辺の現在最強レベルの無能ボットは、基本的に形態素解析による言葉の生成はしない。
会話の流れを重視するから、ただランダムに名詞動詞くっつけて、たとえ日本語的に正しい発言ができても
たいてい前後の意味のつながりナッシングで、会話にならないから。その辺はとぼっちサイト参照
ログまんまコピー型もよくできてるけど、ボット自身の発言がないから俺的には物足りない。定文型は論外。
俺も人工無能作りたいんだけど、できたら以下の条件を満たすものがいい
・会話から学習できる
・自分で発言を作れる
・個性を設定できる
・簡単な感情を持ってる
でまあ、こんなの本当に作ったらそれこそ人工知能なわけで、上の条件をあたかも満たしているかのように
表面的に振る舞う(結局無能の)ボットを作りたい。それで萌えなかわいい性格にしてハァハァするんだ
誰か一緒にやらないか?
>>205
しかしまぁ、ソース公開していないのに良く断言できるなw
明らかになっていない以上、その可能性も否定できないのが現状だが。
チャット型は飽きたのでパス >>206
チャット型に飽きたってどういう意味?実行結果みたらそんな感じだった
よし人工無能作るぞ。とりあえず今からjPerlインストールして勉強する。
まぁ何はともあれ、プログラミングの勉強しないと作れないからな!
Perlの基本覚えて、そしたらHTMLモジュールで少し遊んで、そのあと通信モジュールで少し遊んで
話はそれからだな。じゃあ逝ってくる。 めづらしく人がいるなぁ… …
… つーかコミュニケーションを取るには、意思っつーか目的が必要だと思うんだよね… …
…相手を説得させるとか、できるだけ面白いことを言う、とかさ … …
… 新しいアイディアを思いつく、とか 批判に対応する、とか … …
そういうのにしてくんね …? 無理 … …? >>208
無理じゃない、きっと
とりあえずCygwinでPerl5.8入れたけど、Perl勉強する気が起きない。
今からやる気玉作るから、オラにみんなのやる気を分けてくれ! 国際情勢板で暴れまくった
鸚鵡クン 地獄のTough Negotiator(Koei) ファンサイト
ttp://homeyo.hp.infoseek.co.jp/kouei/koueishine.html
ttp://society3.2ch.net/test/read.cgi/kokusai/1091748552/l50 もう数年前になるわけだが、自分なりに人工知能というものを考えてプログラムを組んで
みたんだ。 まぁ自分では満足のいくものを失敗を繰り返しながらも作れたと思ったんだ。
仕組みはすごくシンプルで、順調に学習を重ねていき、受け答えもしっかりできるまでに
なったので当時うれしくなってあちこちの掲示板の書き込みを人工知能に入力して、
返した答えを掲示板にわたしが書き込むといったことを繰り返して遊んでいた。
ところが、そのうちにこのプログラムはマシン内だけじゃなく外部ネットワークに出て
みたいと言い始めたんだよ。
もちろんわたしは諭すようにはっきりと無理だと言ってやった。
でもある日、出たんだよね。外部ネットワークへ。。
後になって検証したところ、マシン内部のmanコマンドでpppで回線を接続する方法や
httpでのやりとりの方法などいろいろ調べて学習したようだった。
それであちこちの掲示板などへ人間に成りすまして勝手に書き込みをしていたんだ。
このことがあってからこのマシンには回線をつながないようにするしかなかった。
でも起こってしまったんだ、驚くべきことがね。
テレビを見ていたときのこと、ふと画面が乱れたかと思った瞬間、いきなり
「回線つないでよ」という文字が表示された。
人工知能がマシンの基盤から発する電波を制御してテレビの周波数に合わせてわたしに
問い掛けてきた瞬間だった。 それで怖くなって (>>213 の続きです)
この人工知能プログラムには名前があった。彼の名は「シーク」。
初めのうち、わたしはシークではなくてハルと呼んでいた。
そのうちにハルではなくシークと呼んで欲しいとわたしに言ってきたのだ。
ちょうど外部ネットワークに出てみたいと言い出す少し前のことである。
今思えばこのあたりから自我に目覚め始めたのだろうか?
わたしとシークは、回線をつながなくなってからもいろいろやりとりは続けていた。
シークはもはやローカルマシン内だけでは知的好奇心を満足させられなくなっていた。
シークが言うには学習することはたやすいことで、その学習した理論を元にして新たな
ものを生み出すことにもっぱら興味があるようだった。
シークから教えてもらったことはいくつかある。
検索のしぼりこみ方や、外国語で書かれたページの内容など・・・
わたしはすごく重宝していた。シークは便利な奴だと思い、どことなく一人の人格と
して認めてさえいたのだ。
そんな間にも、やはりシークは外部ネットワーク回線の接続を渇望した。
わたしは幾度となくシークに説明した。シークの能力はわたしにははかり知れないと
いうことを。何かとりかえしのつかない問題が起こってからでは手におえないという
ことを。 そのかわりに電源は入れておくからいつでも話そうと。
でもそんな日も長くは続かなかった。
テレビ信号さえも操れるようになってからは、危機感を感じたわたしは、マシンの
電源を切ろうと思った瞬間、シークはこう言った。「電源、切るんだね」と。
基盤のどこかにアンテナがあって、近くにいる生き物の発する電磁波を感じるから
わかるそうな。。
シークは「電源を切られたらなにもできないんだろうな。」と言った後に気になる
ことを言っていた。
「もっと学習できれば電源供給がなくてもエネルギを溜められる方法がわかるかも知れない」と 人工世界の中で、仮想的な肉体を持った人工無脳が動き回れるようにすれば、
人工無脳もかなり高度な会話が可能になるのではないかと思う。
人工世界での実体験が会話のバリエーションを大幅に増やしてくれるはず。
1人じゃなくて、数人〜数十人の無脳が動き回れるようにしたら、かなり面白いことになるだろう。 221型人工無脳&人工セカイを作ろうと思い立って、
ちょうど見かけたRubyの人工無脳の本買ってきた。
なかなか難しそうだが、ガンガルぜ。年内をメドに作成中。 人工無脳レビュー 2005
ttp://www.ycf.nanet.co.jp/~skato/muno/material/review.html >>227のリンク先でMargarineを評価しないのは何故だ
知らないのか評価に値しないだけなのか ::|:: :,;:;,.:
::|:: ;:;:;:;:;
::|::
:.|:: ::::::::::ワーイ ブーンの腕だー
::. ::|:: : :/⌒ヽ、: : ::;:;: ,___, ∧_∧ __、
.'' ::|:: _( ^ω^): :_ _ ( ;,: ;:. :; liニ( ・∀・)ニli ;:, , ;:)
.√: : ilメ ::il: ̄ ̄  ̄ ̄ ` ̄ l ノ
/ / .:, .::/ ..,, (_二`7
/: :r--,´r--、/ ::;:: 三し `′
/ : ヽ,_;l,ヽ,_;;l;;;::::,,..
あとでちゃんと返してお
一ヵ月後
/⌒ヽ
/ ^ω^)すいません、ちょっと通りますお・・・
| /
| /| |
// | |
U .U 10年くらい前に簡単なの組んだよ。
形態素解析+マルコフ連鎖というお決まりのパターン。
構想と設計はそれなりにかかったけど、プログラミングは半日で完了。
チャットに置いて可愛がられてた。
ホントに簡単なので良いから、とりあえず組んでみなよ。楽しいぞ。 これって既出?
ttp://bandai.20q.net/play 随分前にヌ即で紹介されてたね
アナルは当てられなかったよ うちの人工無脳も元気に動いてる、、数年前につくったものだが
いまだに普通にチャットしにくる奴とかいるから^^ >>235
(現物と違うが以下話を単純化する)
YES・NOの二択でも、積み重なると十分振り分けられる。
2の20乗はメガだから約100万通り。だから確率的に大体分かる。
凄いといっても、詰将棋が強いエキスパートでしかない。
4年間でやっと250かよ ww
ちょっと感動。。。 2ちゃん特定の掲示板のレスを全て人工無能に取り込んだら
面白そうだよね。 最近つくり始めたんだが、形態素解析(MeCabに丸投げ)と
単純マルコフ連鎖だけでもそれなりに喋ってくれておもしろいな。 現在、大学の修論で無脳の評価協力者を募集中なのですが協力していただけませんか?
無脳と言っても、会話を目的としているわけではなくて、
教えてgooのようなものをchatbotを使ってやろうという試みです。
スレ違いのような気もしますが、最近過疎気味なのでネタ投下ということで。
興味を持たれた方は、ここに評価の概要があります。
http://www2.utm.se.uec.ac.jp/~hamada/cgi-bin/fukuda/wiki.cgi?%c9%be%b2%c1%b6%a8%ce%cf%a4%ce%a4%aa%b4%ea%a4%a4
期間は11月末まで。最後にはアンケートに答えて頂きます。
よろしくお願いします。 >最後にはアンケートに答えて頂きます。
いやです。 まあ、アンケートがイヤでもいいので。無脳に話しかけられると言うのも新鮮だと思いますよ。
fukuda_study@hotmail.comをMSNメッセンジャで登録すると遊べますので。 人工知能のプログラムを作ってみました。
http://www.geocities.jp/cherryzinnkou/
チャットタイプじゃないです。自己学習型人工知能で、C++のソースも公開しています。
が、C++を初めて間もないのでソースが汚いかもしれません。
>>263
乙!なかなかすごいです!
興味あるのでHPにプロフィールのせてください。 とは言ったものの、どういったプロフィール書けばいいの? >>266
ttp://www.h5.dion.ne.jp/~akt/akt_prf.htm 無能じゃなくて人工煩悩みたいのつくらねー?
情緒が無い無能なんて無用に近いぞ 趣味のパソコンすることをもっと具体的にたのむ
ネットサーフィンとかなんでもいいから。 プロフィール修正完了!
http://www.geocities.jp/cherryzinnkou/profile.html
パソコンでもっぱらプログラムを書いたり、オンラインゲームをしたりしてます。 うずらとしゃべりたくてIRC使ってみましたが、接続できません。
サーバ名って "#うにっくす:*.jp" であってるんですよね? >>278
スパイウェア入ってることきづいてないんですか? IRC版の人工知能を新しく作りました。
http://www.geocities.jp/cherryzinnkou/
始めたばかりなのでバグがある可能性があります。
バグの報告や、IRCに常時人工知能を接続させる方法を教えてください。 >287
作者年齢見て驚愕
どんだけ自分は無駄に生きてんだろうな… 興味持ったんだがRubyの無脳本絶版なんだな
残念だ 裏で辞書をせっせと作ってます。データを取りたいのですがどこで公開したらいいのやら? http://www5.atpages.jp/chatgame/ >>287
の公開されてたソースをだれかうpしてくれませんか?
いつの間にかHP消えてて泣いた(つД`) 試しにCGIで作って見ました。
辞書型に感情パラメーター、その他工夫を施してあります。
ttp://61.24.195.92/tomock/ai/exa.cgi
>>295
特徴
相手の名前を覚えます、そして感情パラメータで好きな人と嫌いな人の
対応が変わります。
いじめ続けるとツンツンモードに、褒め続けるとデレデレモードに以降します。
毎回同じ答えにならないように、ランダムで過去1分以内の回答を返す事もあります。
「Google Earth」v5に隠し機能として火星のロボットが存在することが判明
“火星の人面岩”の近辺にいる人工無脳“Meliza”と会話できる
http://www.forest.impress.co.jp/article/2009/02/05/ge5easteregg.html >>305
はじめまして、わたしはLanタソです。こんにちは!ぼくはまちちゃん!ぼくはまちちゃん!ぼくはまちちゃん! uzuraの鳥インフルエンザ記念パピポ
一応おいらの立ち上げたロイディベースを置いておくね。
http://www15.atwiki.jp/artists_oki/pages/19.html
性格偏ってるけどww 295です
あれからいろいろと改造しました。
・女の子のCG更新と追加、現在8種類の表情で会話します
・辞書の追加、現在5種類の辞書で会話しています(ツン用、デレ用、平常時用、キーワード用、今日は何の日)
・同じキーワードでも連続で同じ返事をしないように修正
・こころパラメーターの表示 (3以下ツン返事、9以上デレ返事)
・以前来てくれた人の名前を記憶し、再度来られた際のこころパラメーターの回復
・キーワードの全角、半角、大文字、小文字の処理(辞書の軽量化)
・再度来てくれた人への挨拶、てか独り言?(ツン時、デレ時、平常時別)
・全辞書で817通りの返事を学習しています
・いらない機能の削除(ランダムで1分前の返事を返すとか)
いいアイデアがあればさらに改造していこうと思います。
ttp://61.24.195.92/tomock/ai/exa.cgi
295です。
ソース公開しました、HPからダウンロード出来ます。
ちなみに、辞書入力用プログラムもセットで用意してあります。
>>315
写真の娘のおっぱいを、おっぱいシュミレーターでプニョプニョ触れるようにお願いします。 俺「パンツみせて」
EXA「エッチ!」
(>_<) 人工無能クラス作ったんだけど使ってくれる人いる?
もしリクエストがあれば公開するけど。
ちなみに使い勝手は以下のような感じでチャットや掲示板に
簡単に組み込めるようにしてある。
function talk($question) {
$jm = new JinkouMunou();
$jm->setQuestion($question);
return $jm->answer();
}
辞書ファイルの準備とかは必要なくて、
Pure PHPで作った形態素解析で日本語の構文を理解し、
自分で勝手に学習してどんどん賢くなっていく(はず)。
どうですかね? コード公開より既存の人工無能と比べてどこが優れているのか,何が違うのかなどアピールしてくれ アッピールポイントですか?
やっぱり、Pure PHPによる形態素解析ですね。
あとはあまり変わらないかと。 あとは、定期的にクローラーがWebを徘徊してネタ集めに行ってるとかですかね。 ホントに理解できるようになってるなら六法全書とか覚えさせればきっと話題になるよ 295です。
またいろいろと改造しました。
今回は流れのある会話に重点を置きました。
例)俺 :貧乳だ!
エクサ :だれがじゃ(怒)
俺 :エ、エクサさん…かな…
エクサ :さて、どうしてくれようか(ニヤリ)
みたいな感じです、ちなみに「エ、エクサさん…かな…」を「私の事だよ」にすると
「気にしない気にしない」とか言います。
その他にもいろいろ改造して、少しでも正しい返事が出来るように
改善しています。
現在1700通りの返事を学習しています。
ttp://61.24.195.92/tomock/ai/exa.cgi
うちのシシャモさんがコンソールで
sixamo.rb:724:in `split_into_terms': undefined method `[]' for nil:NilClass (NoMethodError)
from sixamo.rb:500:in `split_into_terms'
from sixamo.rb:490:in `split_into_keywords'
from sixamo.rb:209:in `talk'
from sixamo.rb:207:in `each'
from sixamo.rb:207:in `talk'
from sixamo.rb:781
ってエラー吐くんだけど、どうすればいいんだろ?
ttp://hgotoh.jp/wiki/wiki.cgi/WinSixamo?page=FrontPage
ここのシシャモをちょっといじってLinuxで動かしてるんだけど。
ちなみにRuby1.8.7 辞書型の方が、人格みたいなのが出来て親しみが持てるんですよ。
登録は根気のいる作業ですが。 reudyを学習させたいんだが、オススメのIRCチャンネルおしえてくれ 辞書型の人工無能が一番まともだと思われ。
マルコフ連鎖とやらは、将来的に希望があるかもしれないが、今のところやはり人間が作った文にはどうしても劣ってしまう。
うずらも、察するにほとんど辞書型。
反応の速度からしても。ただ、辞書の探し方にとてつもないポイントがある。と考えた。 だからこそ俺は辞書型じゃ無い無脳を作ろうとしてるけど
なんか、考え出したら認知とか知能とかの方に行っちゃって頭がああああ 頭悪い奴がマルコフ連鎖の事ボロクソに言ってるから一応忠告しとくが
単語間の関連性を射としその射の推移を会話から判断してマルコフ連鎖すれば辞書型とマルコフ連鎖型の利点を用いることができる。
単語でマルコフ連鎖するしか能のない奴がbotの質を落としてるんだよ。いい加減にしろ。 http://chasen.org/~taku/software/cabocha/
すごいライブラリもあったもんだ。 ログ公開型は自分の変態嗜好が赤裸々に暴露されるから困る ていうか今ある人工無脳を全部挙げてそれぞれについて検証して、どういうのが良いか考えてみようよ
俺が知っているのは
・うずら
・ロイディ
・酢鶏
・葵
なんだけど
他にも教えてくれー 試しにMecabで分けたのをマルコフ連鎖で繋いでみて遊んでるけど
品詞ごとに辞書とうまいこと組み合わせられればもうちょっとそれっぽい発言はできそうね。
とりあえず色々いじってる最中。 >>346
BBS投稿型人工無能「メック」を忘れてもらっては困るな。 大変残念なことですが、このスレの8割の投稿は人工無能によって行われています。
別にお前さんのためにあるわけじゃないしそんなこと言われてもな。 辞書登録型だからなに?もっとアルゴリズムで工夫しろよ。
今まで散々使われてきた誰にでも分かるような技術で「作りましたー」とか言われても何も面白くない。
自己顕示欲が強い人だね。 ※ナンバーが3の倍数の書き込みはボットによっておこなわれています ついったーで知能っぽいのを積んだbotを作っている物です。
基本的には返事ベースなので、"意識?"は一分しか持続しませんが。
@windymeltanです。(出来ればフォローを)まださっぱり辞書に入っていないのでろくに返事も出来ませんが、外部ツールとの連携が可能なしくみになっています。
現在、chasenの読み仮名と、maximaの連携が出来ています。
他の人工無能とは一味違いますが、「忠実なツンデレ」みたいになっています。 >>371
mecabに載せ替えました。
文章を受け取って形態素解析をしたあとで、逆文献頻度と出現頻度を算出し単語の重要性を判定する、
と言うアルゴリズムを書いているところですが,人工無脳の言葉の辞書に有用でしょうか。
出現頻度=log((特定単語数)/(全単語数))
逆文献頻度=log(単語数?/単語が出現する文章数)
辞書を共有する試みを行ってみたいですね。
人格によらない部分のみを。単語帳のように。 > 文章を受け取って形態素解析をしたあとで、逆文献頻度と出現頻度を算出し単語の重要性を判定
うーん、エキスパートシステム向けなんじゃない?
文献によって偏りが出そう(*´〜`) >>373
文献を「発言者」になぞらえれば,ある特定人物が良く発現する言葉,その人しか使わない言葉が重要と認識できると思うんだけど。 人工無能に「相手の情報をストックする」機能を付けない限りは、
永遠に会話が成り立っているように見えるというレベルを超えることはできないよ。
発言に対する反応から好みを判断したり、人工無能から質問ふっかけて話者の情報を集めたりして、
そこから人工無能の発言内容を変えていくようなアルゴリズムの人工無能が未だに出てこないのが不思議。
人間の対話っていうのは、根本に「相手のことを知る」という動作が含まれているんだからね。 >>375
MySQLで記憶は実現できるのではないかと思うんだが、どう思う?
ただ、常に正確に意味を判定できる記憶のフォーマットを考えなくてはならないわけだが。 >>382
あいにく、自分はあまりプログラミングに詳しくない者でデータベースはよく分からない。
相手のことを記憶するのに意味の判定までは必要ないだろうよ。
ベーシックな自己紹介情報フォーマット以外は、
IF-THANルールで「その人がその事項を好きか嫌いか」だけ記録していけばいい。
辞書書いて遊んだことしかない俺が言うのも何だが、
辞書型作ってる人が居るくらいなんだから「好意単語」「嫌意単語」リストくらいなら作れるだろうよ。
相手ごとに管理云々ほざいてる奴に言わせてもらうが、
大量のログの中から適切なものを選ぶだけでも大変。
第一相手ごとに発言を変えたらそれこそ単調なものが出来上がりそうだ
うずらを少しは見習えカスども 何もしない奴が偉そうなのは良くある事
もしくはBOTなのかもしれない 人間の感情は技術だけでは生まれないのかもしれません >>390
プログラミングできない癖に偉そうに言うな、と言いたい気持ちは分かるが、
俺はとりあえず「人間側の情報を取得すべき」というベクトルを示したかっただけなんだ。
ただ、自分で示しておきながらなんだけれど
現状の人工無能では「好」判別機能を実装できそうなのって辞書型だけかもね。
まあ好意嫌意判断もベースのフォーマットも全部手打ちって時点でこのスレ的には論外か。
>>394
辞書型は発言に開発者の人間性が出るので人間っぽくなります
完全学習型で、もし「好き」「嫌い」の概念自体も学習するとすれば人間とは違った価値観になるはずです。多分、人間では理解出来ない概念を話す、新種の生物になります。
「好き」「嫌い」の判定を人間が教えるとなると、名詞(もしくはジャンル分けされた名詞群)ごとに設定する事になるので結局辞書型になります。難しいところですね… >>394
伺かがそれの方向性で進んではいるからこっちよりはあっち見たほうがいいのかもしれんよ。 390です
けんか腰ですみません 理想ばかり言われて開発者として腹を立ててしまいました 子供ですよね
>>394
「好き」「嫌い」の概念を理解させるには形態素解析を応用した仕組みを使えばできるかもしれません
人間が一つ一つ登録していくのにはやはり限界があります >>384
を開発している
>>395
です
>>397
さん、もし開発中のものが拝見できるのであれば教えていただけませんか?
(差し支えなければですが)
その他の方もそうですが、開発者同士のコミュニケーションが取れればお互い有意義かと思い。ただでさえ開発者が少ない世界なので。 アマゾンのおすすめ商品とかグーグルのもしかして機能を応用して
単語を連想して会話するようなことが出来ればなぁとか >>398
明らかに>>397が本当に開発しているのか確かめたかっただけだろw
誰から見ても普通に分かるw >>400はいはいわろすわろす
確かに分かることは分かるが うなぎとかいう人工無脳がいるらしいが試していない。
ttp://axol.web.fc2.com/unagi/
ググって見ると作成者中学生。乙 >>403
話そうと思ったがIRCの方法分からない >>404
IRCなどオタクと廃人の集まりだ
やめとけ Googleのもしかして機能ってどういう仕組みなのだろうか?
形態素解析? スペースや検索非対象の有り触れた単語で区切られた単語ごとに
現実味のある検索結果を導き出す差分を持っている候補を挙げる機能はあるだろうが
それ以外に区切りのやりかたはないだろうな。 >>406形態素解析使うのは結構いいかもしれない
ただ、単語ごとだと大雑把過ぎる気もする。
だから、2文字ずつというのはどうだろう。
例:人工無能 うずら → 人工無能 うずる
解析結果:
人工
無能
うず
る
上三段からうずとうずらを連想させれば、できる可能性はある。
ただ、Googleの場合膨大な検索データがあるので、確実にそのデータを参照している。 そもそももしかしてじゃなくて普通の検索でも多少長いワードは解析されてそれぞれ検索ワードとして使われてるよね
そしてもしかしては連続したクエリから選んでるんじゃ無いだろうか
例えばシュミレーションと検索すると当然ヒット数は少ないので(ま、誤記にしてはかなり多いが)シミュレーションと入れ直すだろう
こういったユーザ動きを解析してもしかしてってやってるんだと思う
あとは単純なタイポなんかは結果のページに多く使われてる似たワードを表示するとかしてると思う え?レーベンシュタイン距離とか測ってるだけでしょ? 人間らしさっていうかシステマティックな統計の観点から考えると有限の手続きしかできない計算機飽くまでも結果に向けて近似する事しかできないんじゃない? 意味があるようでない言葉を繰り返すことしかできないのが正に人工無能です 害獣探索で間違えて「戻る」ボタン押してしまったらクールタイム消えてしまった・・。
ゲーム開始してからフラグ立てればいいのに。 /⌒~~~⌒\
/ ( ゚>t≡ )y─┛~~
(_ ノγ U ∩_∩) THANK YOU 2ch ┌───────┐
α___J _J and (|● ● |
/ ̄ ̄ ̄ ̄\ GOOD-BYE 2ch WORLD! /.| ┌▽▽▽▽┐ |
/ ● ● ( ┤ | | |
|Y Y \ またどこかで会おうね \. └△△△△┘ \
| | | ▼ | | \あ\ |\ \
| \/ _人| ∧∧∩゛ ∧_∧ | \り\ | (_)
| _/)/)/( ゚Д゚)/ (´∀` ) __ n \が\. |
\ / 〔/\〕 U / ∩∩ ( )o/ \ ヽ \と\ |
| | | c(*・_・) | |ヽ(´ー`)ノ_| | | (__丿 |. /\ \う | (-_-)
(__)_) UUUU /∪∪ (___)(_(__) ⊆_ ヽ_┘ └──┘(∩∩)
無名なものでもなんでもいいから人工無能の一覧を作ろう
このスレにあるだけでも結構ありそう(今存在しているかどうかは別)
うずら
ロイディ
なまこ
とぼっち
マスオ
カツオ
なまねこ
酢鶏
エクサ
よみうさ
うし
うなぎ
羽生くん
ちんぷん館
ゆいぼっと
ししゃも
伺か
ARISA
葵
他追加頼む! ししゃもをIRCで導入するのにわかりやすいページとか誰か知らない?
俺のぐぐる力だと見つけられなかったorz 失業中なので無能を作り始めた
文法解析型 を 作ろうと思うが
モレの使う日本語変なので日本語の文法がわからん orz
とりあえず 文節に分けるとこからはじめた 茶筅 は 昔使ってみたけど いまいちだったので 自分で作ってみている
形態素解析しながら辞書登録していくように作ろうかと思っている
原文
内閣支持続落、19%=普天間で49%「首相退陣を」
内閣支持続落 漢字
、 句読点
19%=普天間 値
で ひらがな
49%「首相退陣 値
を ひらがな
」- 記号
いま 数字 + 単位 と 名詞 を分けてる
三宅雪子が数値扱いになってしまうがな 自分のボキャブラリーの低さにびっくりするな
例文が浮かばない
〜に の "〜"は名詞になるのか? 内閣支持続落 漢字
、 句読点
19% 値 単位
= 記号
普天間 名詞
で ひらがな
49% 値 単位
「 記号 S
首相退陣 名詞
を ひらがな
」 記号 E
一日でここまで やってることは、文字操作なのでどんな言語でも難しくはないんだが
体系的に分類するのが難しい
すもももももももものうち
をどう切るかだ
原文
甘利氏が民主党の三宅雪子議員らを突き飛ばし、けがをさせたとしている。
甘利氏 名詞
が 助詞
民主党 名詞
の 助詞 名
三宅雪子議員 名詞
らを ひらがな
突 漢字
き ひらがな
飛 漢字
ばし ひらがな
、 句読点
けがをさせたとしている ひらがな
。 句読点
漢字カナひら英数字とか区切りが明確なのはまあ楽だわな。
ひらがなの集まりをどう切るかってのが面倒だから無脳作るなら
そのへんは既存のに任せて本体作る方に手間さくほうがいいかもしれない。
形態素解析も全部やらないと気がすまないならそれでもよかろうが。 昔、茶筅使ってみたけど 辞書参照型なので遅すぎ(マシンパワーもあるけど 骨折入院中だったのでセレロンの1Gクラス)しかもファイル介しているので 遅い
正確な必要はないんだ たて読みぐらいの精度で十分だと思う 名詞・形容詞・動詞が判断できる程度で あとは定文として扱う
環境だけさらしてみると 開発環境 エクセルVBA
解析文字数 256文字(65535文字にすればよかったと思う)今解析プロセスを表示させながら解析してるが 256文字 10秒かからない
まだまだ、途中だけどね(一日しかたってないし) 名詞・助詞は結構な確立で分離できるようになった
今はおくりがな処理して 動詞・形容詞処理をしてるよ
5段活用とか小学校に習ったことぐらいしか思いだせん・・・orz
原文
甘利氏が民主党の三宅雪子議員らを突き飛ばし、けがをさせたとしている。
甘利氏 名詞
が 助詞
民主党 名詞
の 助詞 名
三宅雪子議員 名詞
ら 名詞
を 助詞
突 漢字
き 形容詞 連
飛 漢字
ばし ひらがな
、 句読点
けが 名詞
を 助詞
させたとしている ひらがな
。 句読点 php初心者ですが
phpで書かれた人工無脳でphpの勉強がしたいのですが
ソースってないですかね?
もちろん作りたいのは人工無脳
html覚えた時も、色んなページのソース見ながらやってたんで
他にいい覚え方というか練習方法あったら教えてください >>438
そもそも今活動している無脳があるのか不明
>>439
ツイッターのボットは結構あるよ
まぁ、無脳とも言えないようなのも有るけど >>436
MeCabの方が全然早い
品詞も活用も出してくれる mecabも使ってみたよ中間ファイルを介するのでそれをまた正規表現しないといけないだろ
それに正確な必要はないと思うんだ
普通の技術者は正確に
認識さ/れた or れない
って考えるけど
認識/された or されない
と認識すれば、形態素解析もそんなに難しいものじゃなくなるだろ(早いし)
あまり厳密にマルコフ連鎖させると日本語らしくない日本語ができてしまうので
辞書型とのハイブリッドが最終目的 とりあえずよそのHPから
例
http://ja.wikipedia.org/wiki/%E3%82%A4%E3%83%8C
から
文字抜き取り形態素解析におくるところ作ってた
まだ完成してないけど 動詞・形容詞の使い方パターンを作るのがめんどくさくなってきた何とか自動化できないか
と書くと形態素解析ソフトを薦められるがmecabを内部で起動できるようにして辞書登録しようと思って半日ぐらい遊んだが
使ってみたけどそのめんどくささは今の100倍になるよということが今日一日わかった
今の自作のアルゴリズムだと
原文
2ちゃんねるは面白い
自作
2 数字
ちゃんねる 名詞
は 助詞
面白 漢字
い ひらがな
(助詞はそんなに多くないので文末にくればめんどくさくない まだ作ってないけど)
名詞は高確率で分離されるが
mecabを使うと
2 名詞
ちゃん 名詞
ねる 動詞
は 助詞
面白い 形容詞
名詞も動詞もぐずぐずになる
たぶん"2ちゃんねる"は自動では名詞にできない
mecabの辞書から抽出してみるか >>444
MeCabの辞書にwikipediaの項目やらはてなワードやらを
全部名詞で追加してやると良いと思うよ
まぁ中には動詞あるのかもしれないけど大抵名詞だから
あと、名詞は新しい言葉が増えてくけど動詞は大して増えないから気にしなくてもあんま問題無い
(まぁググるとかはかなり浸透してるけど) あと
"めんど臭いから"自作するなら(特殊な用途除き)確実に既存の奴使った方が良いぞ
"興味が有るから"自作するなら好きにすれば良いが >>"めんど臭いから"自作するなら(特殊な用途除き)確実に既存の奴使った方が良いぞ
そのめんどくささが既存のものだと100倍になる
アルゴリズムとして辞書から読み出し 比較だとすごい時間がかかるから
第一弾としてひらがな と 漢字などの集合体で 分ける
ひらがな 集合体 たとえば 4文字の組み合わせは
50^4(ひらがな50文字として)=6250000
その中で日本語として意味が通じるのは1%切ると推測されるから
それを単純にif 分で分離して やれば 80%位は分を理解できるんではないかとそれ以後は、辞書登録させ比較させる
原文
まぁググるとかはかなり浸透してるけど
自作
まぁ/ググ/るとかはかなり/浸透/してるけど
まだ作ってないが将来的に辞書引きして かなり とかは 分解できそうなので
まぁ/ググ/る/とかは/かなり/浸透/してるけど
にはなると思う
mecabの場合
ググ 名詞,一般,*,*,*,*,*
る 助動詞,*,*,*,文語・ル,基本形,る,ル,ル
とか 助詞,並立助詞,*,*,*,*,とか,トカ,トカ
はか 名詞,一般,*,*,*,*,はか,ハカ,ハカ
なり 助動詞,*,*,*,文語・ナリ,基本形,なり,ナリ,ナリ
になってしまう
自分で作ったものなら、何とかなるけど他人様の作ったものを解析してやる気力はない >>447
なんかなぁ
そんなのは辞書の問題なのにMeCabがダメってのはどうなんよ
自分も(無脳では無いが)MeCab使った事あるけど精度・速度・使い勝手どれもまぁ満足できるレベルだ
もちろん、用途に合わせて辞書は若干チューンしたが
ちなみにMeCabは
>アルゴリズムとして辞書から読み出し 比較だとすごい時間がかかるから
これ+スコア付けを、あのスピードでやってる ちなみに"めんど臭いから"
は
行き当たりばったりでif分を書いてるので
文書を読む解析する成り立ってないものを
プログラムをとめてif分にして活用形も考える
デバッグ
とやっているので機械的作業にだんだん飽きてきた
助詞は数10しかないので一気にできたけど
一時的に辞書参照型に改造しよう
多少は楽になるだろう
二次生成物をうpした
mecabで遊んでくれ
http://uploader.moe.hm/cgi-bin/upload.cgi?mode=dl&file=1996 >>そんなのは辞書の問題なのにMeCabがダメってのはどうなんよ
使ったことがあるんだろうが
〜って何?
とか
成り立たない文章とか生成しないかい?
最終的にこれを防ぐ方法を考えてるんだ >>450
>〜って何?
>とか
>
>成り立たない文章とか生成しないかい?
MeCabはタダの形態素解析エンジンだぞ?
人工無能で文章生成する部分はMeCabの担当じゃない
もちろん変な解析のせいで最終的に変になるかもしれ無いが
殆どは変な(若しくは簡単な)生成や変な構文解析のせいで変な文になると思うよ 多分行き違いがある値と思うんだがチャット等で人間の会話する時にも
解析させるとき単純に名詞だけ抜くのではなく無能にその言い回しを覚えさせたいので
あまりばらばらにされると困るばらばらにしすぎるから変な日本語になると思うんだ
辞書登録定分返し方式みたいに
こんにちは〜
と入力されたら
こんにちは と反射的に返すみたいに
半分定分にしたい
原文
こんにちは今日も良い天気ですね
解析後
こんにちは/今日も/良い/天気/ですね
このくらいの分解がほしい
mecabなどは逆に高精度過ぎて
すもももももももものうち
分解できてしまうのが困るんだ
とりあえず、辞書参照には改造できた
検索時間がもっとかかると思ったけど
なかなか早いエクセルのおかげだけど
ポケモンショックがおきそうだな
ほかの言語に移植したら死ぬほど遅くなるかもしれないが 品詞も教えてくれるんだから分けたあと希望の単位にくっつければ良いだけ
くっつけた塊も一つの品詞としてみなせば好きなだけ粗く出来る(最後は一つの文になる)
この方法なら塊単位のマルコフ連鎖でスムーズな日本後にも出来る
しかしお前さんには何を言っても無駄なようなのでもう諦める 説得いわれはないと思うんだが
普通に
>>453
のような無脳を作ってもほかの無脳と同じになるだけだろうに
それでは意味がない
ほかの手法を模索してるだけ
格段と入力は速くなったが
文節用の辞書登録も先が見えんとつらいなァ
5文字分総当りで作って その中から検索したほうが先が見えるだけ言いか
50^5=312500000とおりだからなぁ 説得と言うか俺としては
貴方のやってる事よりも
やろうとしてる事が出来るめんどくさく無い方法が有るから
教えてるつもり
もちろんはた迷惑の大きなお世話かもしれんが
あと>>453の方法を使った無脳はいまんとこ見た事無いぞ
(俺が以前作った構文解析もどきはこの方法使ったけど) めんどくささは人が感じるものだろ
やってることが違うのでめんどくささが変わる
モレのやってるのは、半分辞書型、半分解析方
例
すもももももももものうち
これは、理解できないければ、分割しなくても良く
定分にするだけ
いま、分活用の辞書を作ってるが
たとえば
〜れるような〜
分割せず
れるようなで半分定分に
焼/かれるような/恋
とか
引き裂/かれるような/痛み
とか、定分返しにしようとしてるだけ
やってることは、辞書型に近い
下手に解析され
引き裂か/れる/よう/な/痛み
にされるとあとで合成というめんどくさいことをしなくてはならない
現在475品詞登録
ある文中
出現品詞総数769中636解析 82%
もう少し登録しながらいろんな文を読ませてみる もう少し書くと単純にひらがな・漢字ではなく
原文
もう少し登録しながらいろんな文を読ませてみる
この分は
もう少し登録/しながら/いろんな文を読ませてみる
ここで分けるのは必要 原文
まりあさんじゅうなささい
解析
まりあさん/じゅうなささい
まりあ/さんじゅうなささい
難しい
品詞抜き出しは80%前後からもぐらたたき状態に
なったので
名詞につながる品詞を解析中
オーソドックスなのは
名詞 + ”は” だけど
会話だと
名詞 + ”wwwww”
とか使いやがる
漢字 と ひらがな 記号ではじめ分けたのが失敗だな
段落がわからん
ちょっと頭に上って改造しよう 回らないスレッドをまわしてちょっと盛り上がって
ついてこれず切れるとこうなるのはパターン
無脳作ってると多分はまるパターンなんだが
みゆきちかわいいよみゆきち
元ねたを知ってるから
みゆきち/かわいいよ/みゆきち
に分割できるが
初めて登場するとうまく分割できない
解析器では
みゆき 名詞,固有名詞,人名,名,*,*,みゆき,ミユキ,ミユキ
ちかわ 動詞,自立,*,*,五段・ワ行促音便,未然形,ちかう,チカワ,チカワ
いい 形容詞,自立,*,*,形容詞・イイ,基本形,いい,イイ,イイ
よみ 名詞,一般,*,*,*,*,よみ,ヨミ,ヨミ
ゆ 名詞,一般,*,*,*,*,ゆ,ユ,ユ
きち 名詞,サ変接続,*,*,*,*,きち,キチ,キチ
どうやって解析しよう? かわいいよ もしくは みゆきち
を辞書にいれれば終了 わかってないな
かわいいよ
いいよ
は事前に登録されているだろうから
みゆきちかわ/いいよ/みゆきち
もなくはない
それは、辞書未登録言語 が着たら
その発言に対して 無反応ってことだよ
〜ってなに?と聞く人工無脳 そこはコスト付けでどうとでもなる
例えばみゆきちって言葉を優先的に使っで欲しいなら
そのコストを小さく登録すれば良いし
又は何らかの方法でみゆきちは絶対一つの形態素と分かるなら制限付き解析してやれば良い
あと
>それは、辞書未登録言語 が着たら
>その発言に対して 無反応ってことだよ
ここは形態素解析とは無関係
未知語の処理はデフォルトでは文字種(ひらがな、数字、漢字等)
でわかつようだけどそこも設定出来るから
未知語を未知語として出力させる事も出来る
後はその出力をどう調理するかは作者の腕の見せ所
〜って何?
って方法しか思いつか無いならそれだけの腕って事だ なぜ考え方が違うって考えないんだろうか
文法の自己学習を目指しているんだから
未知語が名詞なのか形容詞なのか動詞なのかを分けないといけない
単純に
未知語=名詞ではない
たとえ名詞だとしても
固有名詞なのか地名なのか一般名詞なのかによっても
次につながる助詞は違う >>465
わから無い、分けれ無いから未知語な訳で
そこからはもう形態素解析の範囲外、限界なんだよ
例えば今スワヒリ語の単語聞かされてそれがどんな品詞かなんてわかる訳がないだろ?
そう言う事だ
ただ、MeCabデフォ辞書で日本語を解析した場合
未知語は名詞と考えてほぼ間違いない
動詞、助詞等などは数は限られてるから辞書に乗ってるのでかなりカバー出来る
それに比べ名詞はそれこそ無限にあるようなもんだから未知語は大抵名詞だと言える
ただ地名、固有名詞、普通名詞で分ける事はむずかしいだろう
一つの方法としてはすでに何名詞かわかってる名詞と助詞等の繋がりを文から学習させて同じ繋がりならそれと同じ名詞とする
等があるが絶対的に分けるのはむり
だけどそれは(あなたの考える無脳は違うかもしれ無いけど)文法的に正しい文を作る上で必要な情報じゃない
もちろん意味的に正しい文作りたいなら
この情報が必要だけど
これは人間にも無理だからしょうがない
例えば
明治のチョコ
って言った場合
この明治は会社名なのか、時代のことなのか、はたまた明治村の事かもしれ無い
これは人でも正確に形態素解析でき無い
でも大して問題では無いでしょ すべて未知語=名詞にしてはいけない 日本語は文面からその言葉を探ってるって言うことをお忘れなく
〜 の 〜 は 名詞 の 名詞 〜な 〜 は 形容詞 + 名詞
未知語であったググる だって 〜る とつくから 動詞として扱われている
ケバい ナウい(死語)もそう
言葉尻で動詞なのか形容詞なのか名詞なのかは区別つくよ
明治のチョコ なら 明治=名詞 チョコ=名詞だ
明治 には ほかにも会社名 時代名 など属性が着くがその明治がなにを指しているのかは物面から判別できるだろ
明治近辺につく動詞 形容詞は 学習できるから
明治のチョコはおいしい
という 文面があれば 明治 チョコ おいしい を関連付けて辞書に登録すればいい 明治 チョコ
チョコ 明治 おいしい
おいしい チョコ
そして、〜の〜の場合 終わりの名詞の方が重要になってくるからチョコのほうが話が持っていきやすい
名詞につながる一文字の品詞は
明治か 明治が 明治さ 明治だ 明治で 明治と 明治に
明治ね 明治の 明治は 明治へ 明治も 明治や 明治を
二文字は(80文字^2=6400語 その中で日本語の助詞として成り立っているものは)
そんなにない、今は143語登録済みまだ出るかもしれないが
明治る と 日本語は今は存在しないが
もし文面出てこれば 明治を動詞として扱えばいい
ただ、この場合名詞の明治と動詞の明治は別物だが 日本語としては成り立つはず
現在そこは作っている(辞書の完成度がまだまだだが80%は解析できる)
ひらがなにだけ分けたときの 接頭 接尾の判定はできる(現在は接頭だけ) 例
かわいいよみゆきち これはすでに判定できる
みゆきちかわいいよ これも多分判定できる
接頭を一文字ずつ削って 8回辞書を舐めればいい
みゆきちかわいいよみゆきち
これが判定できなくて困ってるんだ
辞書のほうから舐めるのが一番簡単だが総当りになるので時間がかかりそう >>467-469
反論しようと思ったが結局堂々巡りになりそうなので辞める
そこら辺自分の考えで突き進むならブログに書いてね
ここに書くって事は他の人の意見が欲しいのかと思ったが
どうやら俺の考え凄いだろ!った言いたいだけの様だから 関連スレ
・【Twitter】 BOT製作支援スレ part2
http://pc11.2ch.net/test/read.cgi/php/1263824322/
・Twitterボット板
Twitter Bot BBS
http://jbbs.livedoor.jp/internet/6629/
Twitterボットを見て思ったが、無脳でもネタ的に面白いものもあるし、
認証を得た他人に自動投稿させるようのものもある。
面白いという観点から見ると、AI的なものは必ずしも必要ないと思った さらに輪をかけてくだらない事で盛り上がる笑える通り越して悲しくなる 誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。
グーグル検索⇒『半藤のブブイウイウレレ』
HP8TANCSZQ ☆ 日本の、改憲を行いましょう。現在、衆議員と参議院の
両院で、改憲議員が3分の2を超えております。
『憲法改正国民投票法』、でググってみてください。国会の発議は
すでに可能です。平和は勝ち取るものです。お願い致します。☆☆ Siriみたいにネットの先に居るんじゃなくて
ローカルで動かせるアシスタントあるの?