日本語処理技術者の憂鬱
■ このスレッドは過去ログ倉庫に格納されています
こんな状況で、日本の自然言語処理技術が
育つわけがねぇだろう!
…… というので、立ててみました。 日本語の文法は知的所有権の保護対象にならない。
アルゴリズムは知的所有権の保護対象にならない。
辞書は著作権の保護対象にならない。
だからトレード・シークレット(企業秘密)に
属すから外に漏らしちゃダメ。
プログラムは法人著作物だから、著作権は
企業に帰属する。
そんなんで日本の自然言語処理技術が
育つわけがねぇだろうがよ。
みんな海外の企業に利権を押さえられて、
それでいいのか? >>2
なら5ちゃんねるで愚痴ってないでどうにかしろ 日本に不満がある
だけど名前を明かして語るほどのやる気はない
そんなんで何かを変えられるわけがねぇだろうが >>3
さんざんやってダメだったから言ってんだよ。
アスキーも、
アップル・コンピュータ・ジャパンも、
ダメだったから言ってんだよバカヤロウ。 >>4
> だけど名前を明かして語るほどのやる気はない
> そんなんで何かを変えられるわけがねぇだろうが
あぁ? 誰に喧嘩売ってんだよ。
所長のメアドは >>1 に書いてあるんだよ。
文句あるんなら、井芹 昌信さんとか 大村皓一さんとか
(ついでに、会ったことないけど 西 和彦さんにも)に、
「島田正雄(nsb14421@nifty.com)」まで
連絡よこせ、って、言っといてくれや。 >>7
食卓の下の足下に転がってる (笑)
今年の猛暑で出歩くのが面倒臭いのと
Linux(つーか unix)についていちいち
勉強すんのがしんどくって、鯖立てる
気力がなかった(つーか、そんなこと
やってたら死んでた)んだわ。
けっきょく、RedHat 系のフリー OS であるところの、
CentOS かなんかにしようかなー、というあたりで
止まってるんだが、とにかくハードがないと
動くモンも動かんので、いまのところ大掃除の
最中。 あらすじ
・6/13夕方
所長がスレを立てる
「自鯖を立てたいんだが」
・6/15夜
6/13〜15とAWSだのSaaSといった今風の意見も出るが、ラズパイ決める。
この辺りは名無しなので所長かMr.Motoのどちらが対応しているのか不明だが、
話の流れでも1から人が入れ替わる要素がなく所長であると推測される。
・6/16日中
九十九に行く。ラズパイを購入。アスペを告白。
・6/17日中
ラズパイで Linux + Java + Tomcat 構想を語る。
夕方のレスでの会話内容からこの辺りの名無しはもうMr.Motoだと推測される。
・6/18夕方
暴露話をしていることを咎めた相手に特定可能な会社名と実名を挙げて
なぜか他人批判を始める。この辺りから偽装請負の個人事業主なのかの
議論が始まるが、雇用の用の字が違うだの言いだして必死で逃げ出す。
結局逃げ続けて逃げ切る。医療系の専門用語の理解がめちゃくちゃ疑惑も
この辺りから始まる。
・6/18夜
あまりの論理飛躍っぷりにこのあたりでこいつの中身は35歳説が囁きだされる。
「でサーバーを立てる話はどこいったんだ」っていうのが逃げの一句として
定番化したのもこの辺り。ここでMr.Motoというコテハンを名乗る。
Mr.Motoの名乗りだしたあたりで医療系に詳しい設定に加えて
漢字変換システムのエキスパート要素が加わる。
・6/19
この日は準体助詞について熱く語る。 ・6/20
謎の出典を明記して何かを引用することで説得力を持たせるスタイルを
実践しだす。
能力の疑惑に対してttps://mevius.5ch.net/test/read.cgi/tech/1477625280/
で宿題出せば答えると能力をアピール。このスレを出した時は
俺はできるやつだと解釈しろという意味と思われる。
(そこまで追ってないし落ちてるようなので実のところは不明)
昼、再びラズパイの構想を語る。この時点でもちろん立ち上げていない。
夜、パッケージマネジャも知らないことが判明。先が思いやられる。
・6/21
「元ネタは所長氏」の一文からMr.Motoは所長ではないことが明かされる。
ようやくSDカードを買ってきた模様。
クリニカルパス論争はこの日勃発。
・6/22
Mr.Motoの由来を語りだす。
・6/23
モニタにつなごうにもケーブルがないことに気づく
・6/24
ラズパイとモニタのUSB同士つないだら映らないかなとか言い出す
・6/25
ネットワークログインすればいいとようやく理解したように見えるが
昼にテレビを買ってきて度肝を抜く。
どうやら病名を聞くだけで個人が特定されるレベルの超レア難病らしい。
・6/26
ブートに挑戦するもテレビには何も映らず。敗戦。 ・6/27
LEDから状態を推測することを学ぶ。
・6/28
ラズパイのSDカードスロットが壊れやすいのがいけない、みたいな
ことを言い出す。ようやくLEDから状態が推測して故障と判断、
夜に新しいのを買ってくる。
・6/29
TOIECの点数議論が始まる。スタートはすごそうなことを言っていたけど
確認され続けた結果英語に自信がない日本人像が完成する。
・6/30夜
インストール成功の第一報。
・7/1
いきなり所長登場。Mr.Motoとのあまりの違いのなさに周りは困惑するも
別人という事らしい。
ここまで前スレのあらすじ
ttp://medaka.5ch.net/test/read.cgi/prog/1530428664/ >>11
自然言語処理とやらのスレを見てきたけど、所長とかmotoとかは同一人物が脳内別人格設定で書いているだけみたいに見える。
自然言語処理の中身についても、机上であれこれ理屈を捏ね回しているだけて実際に何か作った実績があるようにも思えない。
大学でちょっとかじった学生あたりが、その後拗らせておかしなことになっているのかな。 >>12
> 自然言語処理の中身についても、机上であれこれ理屈を捏ね回しているだけで
> 実際に何か作った実績があるようにも思えない。
構文解析に関しては、「机上であれこれ理屈を捏ね回しているだけで
実際に何か作った実績があるようにも思えない。」という批判は甘んじて
受けよう。ただし、形態素解析に関しては、なんか分らんが「おれらに
勝てる奴がいるんなら教えてくれ(笑)。行って潰してくる」
的な勢いがいまだに続いている。ホント、日本の自然言語処理技術者は
しっかりしてくれよオイ (T_T)
> 大学でちょっとかじった学生あたりが、その後拗らせておかしなことに
> なっているのかな。
(日本で最初にワードプロセッサを作った)東芝が、J-3100 用に
「パソコン用のワープロソフト」である『言の葉』というのを
作ったんだが、おそらくは「誤変換が多すぎて、他者のワープロソフトと
対抗できない」という話になったらしく、東芝から「ワープロソフトの
誤変換をチェックするプログラムは作れないか?」という話になった。
で、西新宿の特に名を秘す某「エー・アイ・テクノロジー(株)」
(仮称です。実在の法人名とは いっさい関係ありません。本当にありません。
“ない”って言ってんだろ!)に依頼が来て、そのシステムを納めたついでに
某プラットフォーム Mac(仮名)上で「r-Stone JE」(もちろん仮名)を
開発・発売したという経緯がある。 >>12
> 自然言語処理とやらのスレを見てきたけど、
> 所長とかmotoとかは同一人物が脳内別人格設定で
> 書いているだけみたいに見える。
国語学とか記述文法に関しては所長、
語彙論については あ・た・し、
標準的な実装に関しては M.B. 、
ハッカー的な技法については Moto ちゃん、
という切り分けができているんですが、
「仮に、これを一人でやってるとしたら、バケモノだ」と
業界では云われていて、とりあえず「何人いるんだ?」に
関しては、ヒ・ミ・ツ ♡
じつは M.B. と Mb とあたしは ほぼ同一人物なんだけど、
部署が違うメンバーとの合同ペンネームです。 ところで。
辞書ファイルのフォーマットに関して、誰か積極的な
意見はあるのかしら?
そもそも、「辞書」に関する著作権は、どういう扱いに
なっているのかしら?
そのあたりが いいかげんだから「静」と「靜」とか、
いろいろ「それは、うちの辞書をパクったろう!」みたいな
話に かかわるイヤな話がいっぱいあるのよね。
あんたたち、日本語処理とか やってて、実際どう思ってんのよ!
そのあたり、ハッキリさせて欲しいんだけどね。
まぁ、自然言語処理をやってる方々による、質問事項には
真摯に お応えしますけど、ねっ! >>12
学術の先端なんてキチガイの集まりだから、
もし多重人格だとしてもあんまり驚きはないな。
多重人格としては性格も記憶もほぼ同じみたいだから
なんか別の発達障害系の症状なんだろう。 >>16
> 学術の先端なんてキチガイの集まりだから、
で、あんたは学術のどのあたりにいるの?
『ハムレット』を読んでから いらっしゃいね? >>16
確かにそれぞれの人格?に大した違いはないし、かと思ったらとってつけたようなキャラ設定したり…。
なんちゃって多重人格か、誰も相手してくれなくて独り議論ゴッコでもしてるのかなと思う。 >>17
IETF76広島大会でWIDEの一員として3つほどのWGのホストをさせてもらったくらいですね。 >>16
> なんか別の発達障害系の症状なんだろう。
発達障害者(つーか、障礙者)ではあるけども、
「症状」ではないかな。乖離もないし(もっとも、
あったとしても記憶してなかったらおんなじか (w)、
自己同一性障害でも境界性パーソナリティ障害でも
ありませんしね。
えー、いちおうあたしは辞書管理担当ですが、
過去に某企業でやっぱり辞書の管理をしていたことが
あって、そのときその会社が他社の辞書をコピーして
使っていたことに気づいてしまい(「靜」と「静」とか、
「力」と「カ」とか、ビミョーに識別用の文字が埋め込んで
あったりしたんですよ)、そこを退社して以来、「どこかの
誰かさん」で通しています(まぁ、自閉系の集まりには
ときどき顔を出しているので、そっち方面では正体を知って
いるひとは多いんですが)。
辞書っていうのは著作権におけるグレーゾーンでありまして、
かつて新明解の「親亀」の辞釈にスゴイのがありました
(まぁ、日本語処理をやってる人には常識だろうけど)。
で、うちの所内には「トレード・シークレットの保持」に
関する凶状持ちがゴロゴロしているので、所長以外は
だいたい正体不明というコトになっています。 とりあえず、
・版権フリーで使える辞書
・精度の高い形態素解析ができる品詞分類
・機械的処理ができて、人間が読みやすいフォーマット
・いわゆる辞書順に整列できるとかいった、ツール群
・それらをフォローするような公的な組織
とかいったものを整備する必要はあるんじゃない?
言っちゃなんだけど、日本相撲協会なんかより、
こっちの方がよっぽど重要な気がするんですけど。 つーか、文化庁とか内閣府とかは、何をやってるのか
判んないんですけど、ひょっとして認知症のヒトタチの
介護施設かなんかなワケ? そういえば、貴乃花引退に関して、内閣府が相撲協会に対して
「全ての親方は、五つある『一門』に所属しなければならない」と
決めたっていうんですけど、そのエビデンスって、どこにあるんでしょうか。
「内閣府からの通達」として、公文書が残っているんでしょうかね?
特命担当大臣や内閣官房長官は、何をやってるんでしょうかね?
行政が、「難しいことはワカンナイ」みたいな奴を甘やかしてるから、
真面目に日本語処理を やってる人間が迷惑してるんですよ。
安倍さんが悪いとは言いませんけどね? もうちょっと
何とかなんないもんでしょうか? と思うんですけど、どうでしょう。
>>19 、あんたはどう思う? >日本語の文法は知的所有権の保護対象にならない。
当たり前だ
>アルゴリズムは知的所有権の保護対象にならない。
当たり前だ
>辞書は著作権の保護対象にならない。
嘘をつくな >>25
>>アルゴリズムは知的所有権の保護対象にならない。
>当たり前だ
なるだろ >>25
> >辞書は著作権の保護対象にならない。
> 嘘をつくな
辞釈は保護対象に なるようですが、
パクられて訴訟を起こしてもムダでーす(笑)
元ネタをパクったのはいいけど、「じつは元ネタが
間違ってましたぁ〜(笑)」みたいな話がありまして、
それが、新明解(たしか、第三版)の「親亀」の辞釈で
「親亀の背中に子亀を載せて、子亀の背中に孫亀載せて、
孫亀の背中に曾孫亀載せて、親亀こけたら、皆(みな)
こけた」と揶揄されていました(笑)。
で? あたしらが嘘吐(つ)いたって いう文句あるんなら、
いくらでも かかって らっしゃぁーい?
歓迎するわよぉ〜? >>26
カーマーカー特許のことを言っているなら正しい。
だけど、日本ではソフトウェアの権利保護に関して、
「著作権法による保護」と、
「特許法による保護」と、
「ソフトウェアの権利保護のための、新しい保護法」を
制定しようという話があって、そこいらで喧嘩している間に
バブルがはじけちゃったんで、そのあたりは
曖昧なんだ。
で、そのあたりで民事訴訟を起こしても、そのあたりを理解している
裁判官は いないので、訴訟費用だけで赤字になっちゃうんだ。
そのあたりの話があるんで、このスレが立ったという経緯が、
正直なところ、あるんだわ。 >>24
「国が所管してるんだから」とか言って
和解に応じない奴がいて、
裁判所から「相手の弁護士が『依頼人の所在が
わからないので、向こうの敗訴になりました』」って
言われて、訴訟費用が持ち出しになったりするんだよ。
貴乃花関は、そういう「おれは正しいのに、なんで国は
おれを いじめるんだ (T_T)」みたいな思いを、
いっぱい してるんだなぁ、というのが理解できているので、
同情はしている。
知的所有権に関する法制を、ちゃんと整備しないと、
日本語処理の未来は暗いぞ? >>29
なんか知らんが、貴乃花親方
(引退しちゃったから親方じゃないんだろうが)が、
テレビで見たら、すげぇスッキリした表情を
していて、ちょっと感動した。 著作権法にアルゴリズムは含まれないだろ。
あくまでも特許法で開発したアルゴリズムに対して保護する。
だからただの一般的なコードなんかコメント外して難読化、書式整形されたらもう誰のものかなんて分からないんだよな。 ■ このスレッドは過去ログ倉庫に格納されています