X



自鯖を立てたいんだが相談に乗ってくれ
■ このスレッドは過去ログ倉庫に格納されています
0001所長
垢版 |
2018/06/13(水) 17:07:21.07
自鯖を立てたいんだが、誰か相談に乗ってくれ。

いろいろあって、自前の URL の下にサイトを立てたい。

本来はム板案件だと思うが、マ板の ほうが雰囲気的に合ってそうな
気がしたのでこっちに立てた。すまん。
0228Mr.Moto
垢版 |
2018/06/18(月) 21:01:58.90
>>221
> そもそも清拭をせいしきと読む理由が「生食」と聞き間違えないように

>>225
> 払拭(しょく)は漢音読み、清拭(しき)は呉音読み。
> どっちもあってる。

どっちが正しいんだ(w
0229Mr.Moto
垢版 |
2018/06/18(月) 21:18:14.07
>>225
> だから、医学用語辞典買えって言ってるの。
その医学用語がコロコロ変わるから困ってるんだよなぁ。
「高機能自閉」が「高機能広汎性発達障害」だとか
「アスペルガー症候群」だとか「自閉スペクトラム障礙」だとか。
「自閉症」は「自閉症」でいいし、「精神分裂症」は「統合失調症」とか
言い換えなくてもいいし。
医学用語の検索用のシソーラスとか、どっかの学会サイトで
公開してねぇのか?と思う。
けっきょく、「ない」っつーから作るっきゃねぇ、ってな
話になってるわけだが。
0230Mr.Moto
垢版 |
2018/06/18(月) 21:30:52.10
>>227
ちょっと読んだら笑かしてもらった。ありがとう。

そういえば、某かな漢字変換システムの辞書管理をやってる奴に
聞いた話なんだが、名詞で「る」っつーのが登録されてたから
「なんかの間違いだろう」と思って削除しちゃった奴がいて、
そうしたら「愛する」「画する」「接する」「達する」「発する」の
連文節変換が困ったことに(笑)。本当は五段活用s だから、
「愛す」「画す」「接す」「達す」「発す」が正しいので、その後に
「る」で始まる名詞を探しにいっちゃうんだよね。だから、「る」という
名詞を登録して接続テーブルをごまかしてたわけ。

このあたりのノウハウを公開したくて、自前のサイトを立てようと
思ったんだよね。
0231仕様書無しさん
垢版 |
2018/06/18(月) 21:31:12.37
>>229
常に買い続ければ良いだけだろ。
ATOK使って言ってるか?精神分裂病って変換したら指摘してくれるぞ。
自閉症に関しては、詳細に診断分類が増えているにも変わらずひとからげに自閉症で始末するほうが酷い。

シソーラスも何も、ガイドラインが各学会から出るじゃん。公開されてるよ。
日本精神神経学会の2002年だろ、統合失調症への呼称変更は。記憶してるレベル。

ちなみに、単に呼称が変わっただけではなく、疾病概念から、疾病と人格の可分/不可分から、割と細かく変わってるので、
少なくとも精神科医は単なる呼称変更以上に把握してる。

あのさあ、本当のニーズ解って言ってる?
臨床で何があなたの主テーマなの?
業界人になった気になって、有りもしないニーズを引っ張り出してない?
0232仕様書無しさん
垢版 |
2018/06/18(月) 21:34:50.27
>>230
愛する、はサ行変格活用だろ。愛す、は五段活用なだけで。

何言ってるの?
0233仕様書無しさん
垢版 |
2018/06/18(月) 21:35:46.06
もしかして、FEPの辞書に「サ変動詞」があるの、気づいてないのかな。
0235仕様書無しさん
垢版 |
2018/06/18(月) 23:14:50.10
どうして動詞のあとに名詞がいきなり来るの?
食べログじゃあるまいし。

百歩譲って可能動詞じゃないの?
よくそんな変な変換エンジン使ってるな。
0236Mr.Moto
垢版 |
2018/06/19(火) 08:05:07.54
>>232
> 愛する、はサ行変格活用だろ。愛す、は五段活用なだけで。
サ変だったら「愛しない」になるはずだろ? だけど、実際は
「愛さない」。
こういうのはコンピュータで篩ってみないと
気がつかないもんなんだよ。
0237仕様書無しさん
垢版 |
2018/06/19(火) 08:06:41.40
なんで突然スレ止まったの?
プロが出てきてやりづらい?
曲がりなりにもプロなんだから調子に乗らずに聞いたらちゃんと答え教えてくれると思うけど。
0239仕様書無しさん
垢版 |
2018/06/19(火) 08:11:09.15
>>236
口語の〇〇す、は五段活用とサ変が混ざりあった使われ方をしてるから、五段活用とサ変両方登録するの。
記す、もそうだけど、記さないになる。
でも、属する、は属すとも使う。属しない、属さない、両方使うよね。

日本語って難しいのよ。でも、一定のコンセンサスはあるし、それ通りに変換エンジンは存在するよ。
0240仕様書無しさん
垢版 |
2018/06/19(火) 08:16:02.62
もしかして、体系的にその領域を学んだ事無くて、(学んでいないがゆえに自分だけが悩んでる)問題の事象を、学んだ人から見たら非常にやっつけのような対処法で対処してきた事を、
経験だと思ってる?
0241Mr.Moto
垢版 |
2018/06/19(火) 08:17:09.69
>>235
> どうして動詞のあとに名詞がいきなり来るの?
そりゃあ、連体形のあとには名詞が来るだろう?
形容詞の場合は「美しいです」みたいに、
「連体形+名詞+です」の形で名詞が省略される
例が頻出するが。
「動くです」とは言わないだろ? 「動くんです」と
準体助詞の「の(ん)」が入る。
0243仕様書無しさん
垢版 |
2018/06/19(火) 08:22:25.60
あいするいご、を変換したら、愛する囲碁が第一候補、愛す類語が第二候補になるだろ普通。
0244仕様書無しさん
垢版 |
2018/06/19(火) 08:23:30.21
あ、ごめん。アイス類語という馬鹿な候補も出てきたわ。動詞扱いしたくないみたい。
0245Mr.Moto
垢版 |
2018/06/19(火) 08:25:20.60
>>239
サ変は「する」「しない」だから「記す」(五段s)と「記する」(サ変)の
両方を登録しちゃうと、「記しない」が出てきちゃって、「これ、おかしくない?」
とユーザに指摘される。
「属しない」が正しいというのなら、「昼寝」「チン」みたいな、「名詞化された
動作」として名詞辞書に入れて、「する」に接続させたほうがいい。
そうすると、「動詞の連用形現在+する」と統一的に扱える。
0247Mr.Moto
垢版 |
2018/06/19(火) 08:28:41.53
>>242
「動きます」は、動詞の連用形現在+「ます」。
「動くんです」は、動詞の連体形+名詞+「です」。
解析木が別だから。
0248仕様書無しさん
垢版 |
2018/06/19(火) 08:31:14.80
>>245
記しない、はおかしくないよ。現に変換できるでしょ。
実際問題ここを論文でこだわる先生はいるよ。記すると書いてるんだから、記しないと書くこと徹底してはる。

動詞化された名詞は、名詞にそう入れるもんでもなく、動詞として登録するだろJK。

〇〇する、と昼寝(を)するの「する」は意味が違うから、誤変換になるだろ。時制も一致しなくなる。

なんでトンチンカンな事するの?
0249仕様書無しさん
垢版 |
2018/06/19(火) 08:33:46.45
>>247
違う。
動く(動詞、五段活用、連体形)+ん(助詞、準体動詞)+です(助動詞)であって、名詞は出てこない。
お前の頭の中動詞以外は名詞なの?
0250Mr.Moto
垢版 |
2018/06/19(火) 08:35:21.07
>>235
> 百歩譲って可能動詞じゃないの?
最近は「可能動詞」って立てないで、「動詞に接続する可能の形態素」って
考えたほうがいい、というのがトレンドみたいだよ?
強いて「可能動詞」って言ったら「できる」だけど、命令形の「できろ」も
使うケースがたまにあるので、「運用上の禁止」として扱う方法もある。
0251仕様書無しさん
垢版 |
2018/06/19(火) 08:35:49.61
形態素解析に通してみよう、俺が変な事言ってるのかな?と思って、形態素解析エンジンに通すことも無いのかな?
今どきウェブでもできるだろ。
0252仕様書無しさん
垢版 |
2018/06/19(火) 08:38:25.69
>>250
どこのトレンドだよ…
動詞に接続する可能の形態素って、何言ってるかわかってる?
0253Mr.Moto
垢版 |
2018/06/19(火) 08:40:58.03
どんどん本筋から離れていってるが、面白いから続けちゃえ(笑)

>>246
> 準体助詞であって名詞じゃねえじゃん。
だって単独じゃ使えないから。「もの」とか「こと」と
同じ働きをするけれど、単独の体言として使えないので
「体言に準じた役割をする助詞」ということで「準体助詞」
と呼ばれているわけ。
0254仕様書無しさん
垢版 |
2018/06/19(火) 08:42:48.16
>>253
準体動詞の説明が要ると思ってるの?
わかってて使ってる人間が指摘してて、まだなおお前が指摘できる事ある?

で、「単体の体言として使えない」ものは、名詞か?それが名詞だと言うなら無能だと諦めもつくが。
0255Mr.Moto
垢版 |
2018/06/19(火) 08:54:18.21
>>240
> もしかして、体系的にその領域を学んだ事無くて、
> (学んでいないがゆえに自分だけが悩んでる)問題の事象を、
> 学んだ人から見たら非常にやっつけのような対処法で対処してきた事を、
> 経験だと思ってる?
いわゆる「かな漢字変換」の技術って、そもそも「日本語の記述文法」
っていう学問領域がちゃんと成立していないところで悪戦苦闘した
結果だから、「かな漢字変換はブラックアートだ」って、ずっと云われて
たんだよね。
それに対して、コンピュータを使って「日本語の表現を、記述文法によって
網羅する」っていうアプローチを取ってきたのが我々なんです。
たとえば、「する」(サ変)「来る」(カ変)以外に「いう(謂う/云う/言う)」、
「いく(行く/逝く/往く)」「こう(乞う/請う)」「問う」なんかが
じつは不規則活用(まぁ、音韻的には「いう」「いく」は「ゆう」「ゆく」で
扱えば不規則じゃないんだけど、表記の上では規則に従わないので)だとかいうのは、
普通は教科書に載ってないし。
0256仕様書無しさん
垢版 |
2018/06/19(火) 08:58:09.90
「愛しない」も、ものによっては使ってるな。
ドストエフスキーの白痴は愛しない、になってたわ。下巻な。
文語ならちゃんと使ってるんじゃねえかな。
0257仕様書無しさん
垢版 |
2018/06/19(火) 09:01:16.72
>>255
ちゃんと成立してないわけないだろ。
いつから国語の教科書が存在しとるんだ。

当時のかな漢字変換が辛かったのは、今のように口語が自由すぎるからではなく、コンピュータのリソースの問題だ。
だからSKKみたいな思い切った方向に振ってくるエンジンがあったようにな。

寝言は寝て言え
0258仕様書無しさん
垢版 |
2018/06/19(火) 09:03:45.43
我々なんですって、かな漢字変換のIME作ってたのか?
なんて製品?
0259仕様書無しさん
垢版 |
2018/06/19(火) 09:06:23.62
>>253
本筋に戻すなら、その漢字の共有をどんなサーバを立ててどんなアプリで行いたいの?
ちょっとイメージが沸かない。
0260仕様書無しさん
垢版 |
2018/06/19(火) 09:10:00.61
>>255
問う、とかは、教科書に載ってるはずだけど。
連用形音便の例外(ウ音便)じゃなかったか?
いい歳になってきたがまだ覚えてるぞ。
0261Mr.Moto
垢版 |
2018/06/19(火) 09:10:09.80
>>254
> で、「単体の体言として使えない」ものは、名詞か?
> それが名詞だと言うなら無能だと諦めもつくが。
「体言」は「活用しない独立語」で、「用言」は「活用する
独立語」だったよね?
「金(かね)」「金縛(かなしば)り」、「船(ふね)」
「船端(ふなばた)」「雨(あめ)」「雨漏(あまもり)り」みたいに
「他の語を修飾するときに形を変える語」って体言なんだろうか。
そもそも「体言」と「名詞」って、どういうふうに定義されているんだろうか。
そこまで考えちゃうと、学問領域によって用語の意味が違うんですよ。
0262Mr.Moto
垢版 |
2018/06/19(火) 09:15:25.39
>>260
「問う」「乞う」がなんで例外になっているか、というのには
事情があるんですよ。現在の五段活用ワ行って、もとは四段活用の
ハ行だったんです。ところが、末尾の指標音である h 音が消失
しちゃったもんだから、「末尾の a/o/u が指標音になっちゃっただけど、
一段活用なのに五段活用」っていう一群のグループができちゃったわけ。
そのときに、「問う」「乞う」は使用頻度が高かったんで、
昔の活用がそのまんま残っちゃったの。
0263仕様書無しさん
垢版 |
2018/06/19(火) 09:17:01.95
>>261
名詞かどうかを聞いてるんだ。答えろよ。

体言の定義から不安なら素直に聞けよ…。概念を表し活用の無い語だよ。名詞、代名詞、数詞etc。名詞だけじゃねえからな。

「金」も「金縛り」もどちらも一つで名詞で修飾なんかしてない。
「船」と「船端」も、「雨」と「雨漏り」もな。

学問領域によって変わる事は普通無いだろ。
普通無いものを保管するのが業界専門辞書だが、それでもさすがに準体動詞が名詞には成らん。日本語が崩壊する。

で、名詞なの?準体動詞は。
0264仕様書無しさん
垢版 |
2018/06/19(火) 09:20:29.67
>>262
そんな事聞かれてないだろ。教科書に乗ってるって言われてるんだよ。
0265Mr.Moto
垢版 |
2018/06/19(火) 09:21:41.52
>>259
具体的にいうと、
・漢字かな交じりの文章をページに貼ってクリックすると、
ルビが振られた状態で表示されて、使われてる単語の読みと品詞と
意味が出てくる
・自動的に点字に変換される
とかいった感じ。ほかにもいろいろできるけどね。外人さんには
便利だと思うよ? 漢字読めないと国語辞典も引けないし。
あと、文語もいけるから、古典を原文(つーても、昔の文章は
句読点もカッコもないから、現代風に表記を改めないと
いけないけど)で読めるんで、高校生なんかにも便利かな。
0266仕様書無しさん
垢版 |
2018/06/19(火) 09:25:50.14
>>231
へのレスは?

>>265
「形態素解析ウェブアプリUniDic-MeCab」
みたいなものか?
もうあるに等しいだろ。MeCabとUnidic通してるだけだから、すぐできるぞ。フリガナも。
ラズパイで充分だ。
0267Mr.Moto
垢版 |
2018/06/19(火) 09:26:41.92
あとは取説を含めたビジネス文書の用字用語チェックとかかな。
需要はないと思うけど、「書かされたがらなかった」を「書く+せる(使役)+
られる(他動)+たい(欲求)+がる(溶出)+ない(否定)+くあり(状態)+
た(過去または完了/連体)」の分解するとかは、国文法を勉強する人には
面白いかも。
0268仕様書無しさん
垢版 |
2018/06/19(火) 09:28:50.63
>>267
もう売ってる。うち取説作ってるけど、専用のアプリがあるよ、素人がどうあがいても戦えないクオリティ。
会社のビジネルルールに則ってるかまでチェック出来る。
0269仕様書無しさん
垢版 |
2018/06/19(火) 09:36:02.53
>>266
ああ、これね。
>>231
> あのさあ、本当のニーズ解って言ってる?
> 臨床で何があなたの主テーマなの?
> 業界人になった気になって、有りもしないニーズを引っ張り出してない?
うちらはアスペその他の当事者団体というか、自助グループなわけ。
だから、お医者さんとかは(薬は出してもらいにいくけど)あんまり
関係ないんだわ。
で、アスペの中にはプログラミングとか翻訳とかのスキルがある人がいて、
(色覚異常を含む)視聴覚障碍者とか、療育の支援とか向けのツール
作ったり(点訳を含む)翻訳の支援なんかのツールもあるわけよ。
まぁ、基本的に「自分らが欲しいものを作る」だけなんだけどね。
0270Mr.Moto
垢版 |
2018/06/19(火) 09:40:05.65
ごめん、コテと sage 忘れた。
>>269
> もうあるに等しいだろ。MeCabとUnidic通してるだけだから、
> すぐできるぞ。
あれ、品詞分類がいいかげんなんだもん。解析もショボいし。
こっちは文法記述ファイルをスクリプト言語で分離してるのと、
チャート法一本鎗で解析してるから、解析精度は高いぞ?
0271仕様書無しさん
垢版 |
2018/06/19(火) 09:41:58.06
>>269
じゃあ、医者やコメディカルの真似事は辞めろよ。不愉快だ。
勝手も運用も隠語の理由も知らないならホントにやめとけ。
元コメディカルが言ってるから割と間違いなく現役も不愉快に思うと思うぞ。

翻訳支援だとTRADOSみたいなのを内製すんの?
なかなかハードル高いな。
やりたい事が明確なら、知ったかぶり(と言われて心外だろうがそう見える)発言をせずに、
「これがやりたいから、こういうものがほしい、あってるか?」
「〇〇は昔経験したが、それは〇〇とはどう違う?」
と前に進むように聞いてくれ。

聞いてる以上、お前には知識が足りない事は明確なんだから、自分にハクをつけようとするな。
無意味だから。
別にハクのついてない人間に物を教える事も、ハクのついている人間に物を教える事も、
何も変わらん。

知ってることはふんふん聞いとけよ。
0272Mr.Moto
垢版 |
2018/06/19(火) 09:42:32.05
>>268
> もう売ってる。うち取説作ってるけど、専用のアプリがあるよ、
> 素人がどうあがいても戦えないクオリティ。
おお、そうなのか。できれば製品名を教えてくれ。
0273仕様書無しさん
垢版 |
2018/06/19(火) 09:46:43.40
>>270
ほう。いろんなものを名詞扱いしてなきゃ良いけど。

>>272
色々あるけど、最初にかけるのはJust Right!だな。そっからまだ内製ツールにかけるけど。
0274Mr.Moto
垢版 |
2018/06/19(火) 09:47:09.47
>>271
> 翻訳支援だとTRADOSみたいなのを内製すんの?
> なかなかハードル高いな。
あんな面倒臭いものは作る気はない。
クリップボード経由で訳語リスト作るだけでも、
けっこう役に立つ。
ISAM があれば簡単に作れるよ?
0275Mr.Moto
垢版 |
2018/06/19(火) 09:54:55.35
>>273
サンクス。

だけど相手がジャストシステムだったら負ける気がしない。
苫米地 英人の言語理論とか見たけどさ、コピュラとか述語とか、
ろくに考えてねーんだもん。
長尾 真先生あたりが相手だったら、さすがにビビるけど。
あとはせいぜいアップルかなぁ。
0276仕様書無しさん
垢版 |
2018/06/19(火) 09:57:27.91
>>274
あれでも本業やってると、こういう機能惜しいよな、ってあるんだけど。
業務用途ではないって事?

>>275
なかなか手強いと思うけどね。
単なるチェックじゃなくてどうしてダメか、まで出てくるし。
あとは放送局の原稿作成機みたいなのも参考になるんじゃない?
0277仕様書無しさん
垢版 |
2018/06/19(火) 10:03:43.38
>>274
もう一言だけ付け加えると、ある語句やセンテンスに対して統一した訳語が選べないと、翻訳支援にはならないどころか、出てきた文書がちぐはぐになるよ。
TRADOSまでガッチガチにやらなくても、ある程度メモリ翻訳しないとまともな文書には使えないから、そのへん考えたら単なる索引順次アクセスだと破綻するよ。
0278Mr.Moto
垢版 |
2018/06/19(火) 10:05:16.30
>>257
> ちゃんと成立してないわけないだろ。
寺村 秀夫『日本語のシンタクスと文法 II』を読んでみると、
學校文法は規範文法としては役立つが、記述文法としては
役立たないことがよくわける。
文語文法はよくできているが、現代国語の、“いわゆる学校文法”が
ヒドいという批判は山ほどあるぞ。
大野晋先生の『日本語の文法を考える』の頃からほとんど変わってない。

> いつから国語の教科書が存在しとるんだ。
文語文法でいうと、本居春庭の『言葉の八衢』以来だな。
0279仕様書無しさん
垢版 |
2018/06/19(火) 10:08:18.26
>>278
規範文法で良いと思うけどな。
むしろ、規範文法に則って書けるかをチェックするほうが健全だと思う。
とくに業務ならね。

とりあえずその一本槍でやってるすごいスクリプトは、どんな環境で動くんだ?
0280Mr.Moto
垢版 |
2018/06/19(火) 10:11:39.07
>>277
> もう一言だけ付け加えると、ある語句やセンテンスに対して
> 統一した訳語が選べないと、翻訳支援にはならないどころか、
> 出てきた文書がちぐはぐになるよ。
それは、おれも同感だ。
けど、「どの訳語を選ぶか」っていうのも翻訳者の判断だから、
そのあたりはあんまりチョッカイを出さないのが礼儀だと思う。
「コンピュータ・チェスは人工知能のミバエだ」って訳文を見て、
「いや、fruit fly は、この場合『ショウジョウバエ』でしょ?」
と苦笑したことがある。
0281仕様書無しさん
垢版 |
2018/06/19(火) 10:15:35.18
>>280
そうそう。
だから、選ぶって行為は裁量は確かにそうなんだけど、
一人でたった一冊翻訳するならその通りなんだ。
ただ、何人かで同じジャンルの文書を翻訳した際に、それぞれの文書で訳語が違うのはよろしくない。
なので、二人目の翻訳者や二冊目の文書は、最初に翻訳した人の意思を尊重して、それでもなお別の訳語を使うか、という選択肢が必要になる。
その選択肢が提示されない「翻訳支援」は翻訳支援になってない。二度手間だよ。
0282Mr.Moto
垢版 |
2018/06/19(火) 10:17:07.63
>>279
> とりあえずその一本槍でやってるすごいスクリプトは、
> どんな環境で動くんだ?
昔は C で書いてたけど、Win でも unix でも動いた。
unix で動かそうとしたら「動きません」って言われて
焦って飛んでったら、「こめん、文字コード違うの
忘れてた」って言われてずっこけた(笑)。
今のバージョンは Java で書いてある。JVM が動けば
どこででも動くよ。
0283Mr.Moto
垢版 |
2018/06/19(火) 10:23:47.21
>>279
> 規範文法で良いと思うけどな。
いや、意外にイカンのですよ。
「危ないですから」って書くと「形容詞の連体形の直後に
『です』を持ってくるな。『危のうございます』と書け」みたい
な話になる。そうすると、皇族みたいな文体になるぞ?
「嬉しいです」じゃなくて「嬉しく思います」とか。
規範文法を遵守するのなら、文語体にしたほうがまだ恰好がつく。
逆に「死んじゃった」じゃなくて「死んぢゃった」と書きたい、みたいな
ニーズもあるしね。「書いた/書いちゃった」なんだから、「死んだ/
死んぢゃった」が自然だろうと。
0284Mr.Moto
垢版 |
2018/06/19(火) 10:27:25.48
>>279
規範文法遵守ということであれば、補助動詞「いる」「ゆく」「おく」の
省略も許さないことになる。
「書いてる」じゃなくて「書いている」、
「持ってく」じゃなくて「持ってゆく」、
「取っとく」じゃなくて「取っておく」だと。
それも窮屈だと思うんだけどなぁ。
0285Mr.Moto
垢版 |
2018/06/19(火) 10:36:23.05
>>281
「Wnn」なんかはサーバー上に変換エンジンがあったから、入力時の
チェックを考えると一つの解答だよね。
おれの場合、かな漢字変換じゃなくて形態素解析(つまりは自動辞書引きとか
用語抽出とか)から入ったんで、「ゲラができたときに、そこから用語の
リスト使って、表記のブレがあったら著者どうしで検討する」というので
いいと思うんだ。どうせ、用語索引とかを作るときには、そういう作業は
必要だし。
論文なんかだと、用語を抽出して頻度の高いほう(だいたい日常語)と
低いほう(固有名とかが多い)切ってやって、複数の文献で相関取って、
そこから(専門用語の出現頻度の)傾向見てシソーラスを作る、とか
前もってやっておくと、いろいろ使えて便利だろうと思う。
0286Mr.Moto
垢版 |
2018/06/19(火) 10:41:49.62
>>276
> 業務用途ではないって事?
業界内で、五十代後半くらいの人、いる?
その世代で Mac 使ってた人なら知ってると思うんだけど、
rStone(EJ と JE) のアルゴリズムの実装担当はうちの所長。
0287仕様書無しさん
垢版 |
2018/06/19(火) 11:24:36.81
>>282
JavaがうごくならそれでOKなら、一旦ラズパイで試験環境作るか、
VPS借りて試験環境作れば良いんじゃないかな。
とりあえず動いたな、って所から、スペックに関しては相談していったほうが無駄なコスト無いと思う。
検証ごときにVPS借りるのは金かかって嫌、と言うならなら、GCPの永年無料範囲でそこそこ動くだろ。単機能なら。

>>283
そこは辞書力と言うか語彙力の問題で、危ない、という口語を使おうとするからそうなる。
危険ですので、で良いんだよ。

じとぢは闇が深いから簡単にはいかん。地面で地下、これにルビ打つの深く考えると、諦めて常用漢字表に則るしかなくなるし、現実的ではない。
現代仮名遣いの範囲に留めるべき。

>>284
窮屈だろうが、これは当たり前のように守られて然るべきじゃないか?
どんな文書をターゲットにする気なの?
対象文書の範囲絞っとかないと、テクニカルタームで詰むぞ。
0288仕様書無しさん
垢版 |
2018/06/19(火) 11:27:08.85
>>285
その、表記のブレがあった事をあとから知る、に対して、二度手間だって言ってるんだが。
人の話聞いてるか?
TRADOSは、その用語集を「訳しながら作るもの」に近いよ。どうせ必要なんだし、が必要無くなるの。正しい翻訳補助ソフト使うと。

訳語のブレとシノニムは違うものなので、シソーラスで解決する事自体間違ってる。
0289Mr.Moto
垢版 |
2018/06/19(火) 12:02:53.19
>>287
> JavaがうごくならそれでOKなら、一旦ラズパイで試験環境作るか
おお、ありがとう。
おれらもそう思ったんで、秋葉のツクモ本店(ロボット館)でラズパイ
のキット買ってきた。
ちょっと頑張ってみる。
0290仕様書無しさん
垢版 |
2018/06/19(火) 12:13:14.81
>>289
いくら慣れてなくても半日ぐらいで動くようになるだろうから、どうなったかまた聞かせて。
0291Mr.Moto
垢版 |
2018/06/19(火) 12:13:26.96
他の人の発言を無視しているわけではないので、積み残しの返答は
ちょっと待ってくれ。
で、
>>273
> ほう。いろんなものを名詞扱いしてなきゃ良いけど。
とはいうものの、辞書って、出現頻度が高いものに関しては
「とりあえず、全体で登録」っていうテクニックがあるんだよ。
「やまのうえにはながさきました」が、「山の上には菜が咲きました」に
ならないように、「花が咲く」を動詞として登録するとか。
「丼」っていう字は、「井戸の中に石を放り込んだときの擬音」だ
そうだけど、看板で「丼ぶり」とかあるだろう?
それだと不具合なんで、「丼」に「どん」という読みがなをつけるんじゃ
なくて、「カツ丼」「親子丼」「天丼」「牛丼」「海鮮丼」「中華丼」
なんかを、一語として登録して、ユーザが「丼」を使ったタイミングで
「どん」なのか「どんぶり」なのかを判断する、っていうのが
正しいアプローチだと思うんだ。
とはいえ、かな漢字変換のときに、サーバーに看視されてると思うと
相当イヤだけどな。
0292Mr.Moto
垢版 |
2018/06/19(火) 12:17:53.80
>>276
> あとは放送局の原稿作成機みたいなのも参考になるんじゃない?
ワープロ速記とかだろ?
あれは n-gram 法を使えば十分に性能が出るし、
ユーザ本人が登録して慣れてる部分があるから、
下手にチョッカイ出すと、むしろ叱られると思うんだよ。
だから、手を出すつもりは当分ないんだ。
0293Mr.Moto
垢版 |
2018/06/19(火) 12:25:39.50
>>287
> どんな文書をターゲットにする気なの?
うーん、それはユーザさんと相談してみないとわかんないなぁ。
新聞記事読みたい人もいれば、論文読みたい人もいるだろうし、
古典を読みたい人もいるだろうし。
文法ファイルはスクリプトで独立しているので、
そこを(優先度も含めて)切り替えれば、それぞれ対応できるので。
けっきょく、解析データは有限束(ゆうげんそく)として Java の
コンテナとして返ってくるので、あとは「どういう優先度で第一候補を
持ってくるか」っていう重みづけの話になるんだよね。
0294Mr.Moto
垢版 |
2018/06/19(火) 12:32:25.07
>>287
> じとぢは闇が深いから簡単にはいかん。地面で地下、これにルビ打つの深く
> 考えると、諦めて常用漢字表に則るしかなくなるし、現実的ではない。
そのあたりはユーザの好みに合わせればいいんじゃないか?と思っている。
「システム的に負荷になるから現実的ではない」という話は、
Google が使ってるダブル配列法の元になっている、トリプル配列法というのを
使っているので、辞書引きの手間はそれほどではないんだ。
Oracle の機能が今後進歩して、文字列の直積検索で CONNECT BY が
使えるようになったら、形態素解析なんか一行で書ける(笑)。
0295Mr.Moto
垢版 |
2018/06/19(火) 12:45:09.09
>>279
> とりあえずその一本槍でやってるすごいスクリプトは
ぜんぜん大したことはない。
[始端の文法属性]-[マッチング文字列]と「変換後文字列」
-[終端の文法属性] (品詞分類)
だけ。
だから、
> Oracle の機能が今後進歩して、文字列の直積検索で
> CONNECT BY が使えるようになったら、形態素解析なんか
> 一行で書ける(笑)。
っつー話。
ただ、「いる」の省略形で、たとえば「書いてる」みたいなのが
あるだろ? それが、「い」が「いる」の連用形現在と一致してるもんだから、
「動詞の連用形は動詞にかかる」っていう規則に引っかかって、
「書いて(い・い・い・い・い・い …)る」と解析されて無限ループに
入っちゃって、酷い目に遭った。
現在は「〜ている」を文法記述に含めているので問題はなくて、
「〜とる」とか「〜ちょる」とかも解析できるんで、結果オーライだ。
0296Mr.Moto
垢版 |
2018/06/19(火) 12:49:46.99
なんかレスしてないエントリがあったらツッコミを入れてくれ。
真面目に答えるから。
あと、普通に質問とかツッコミをしてくれるのは、
仕事勘が戻るので非常にありがたい。

               長らく病気してたんで、仕事勘が戻らんのよ。
0297Mr.Moto
垢版 |
2018/06/19(火) 12:58:49.17
そういえば、前のほうで
「準体動詞」
とかいう話が出てきたけど、正式には
「準体助詞」
な。
動詞は自立語だけど助詞は附属語だから。
0298Mr.Moto
垢版 |
2018/06/19(火) 13:11:50.06
>>258
> 我々なんですって、かな漢字変換のIME作ってたのか?
あ、遅レスでごめん。
VJE-βの後継製品を作ろうとしてたら、
アスキーとインプレスが分裂してプロジェクトが
コケたらしい。
あと、「ことえり」のグループが、Mac OS の 7.5 か
なんかでスピーチ・シンセサイザーが標準搭載
されたんで、「おい、日本語の漢字かな交じり文の読みびらきは
どうするんだ?」ってな話になったそうだ。
で、WWDC の会場で、「待て、rStone-JE はやってるぞ!?」っつー
話になって、チェアマンの一人(なんか、日本人では初だったそうだ。
中学生程度(アメリカのだが)程度の英語力もないくせに、
ビル・ゲイツのジョークブックとか翻訳で出してやがる)
である藤本 裕之を問い詰めたところ、エースのジョーばりに、
「ちっちっちっちっち、今はあんなもんじゃないんだぜ」と
ホザいたという話を藤本っちゃん本人から聞いた。
0299仕様書無しさん
垢版 |
2018/06/19(火) 17:51:07.47
>>292
違うよ。テロッパーもプロンプターも、自主基準に合わせた文章になってるかすごい細かく校正してくれるの。
0300仕様書無しさん
垢版 |
2018/06/19(火) 17:51:48.85
>>294
ユーザの好みに合わせる、が、現実的でないと言ってるんだが…
0302仕様書無しさん
垢版 |
2018/06/19(火) 17:53:44.09
で、動いたのかね、とりあえずJavaだけでも。
helloWorldぐらい実行出来たのか?
0303Mr.Moto
垢版 |
2018/06/19(火) 17:58:56.45
>>299 >>300
入力のメソッドに好みがあるだろうが、
文章そのものにキッチリしたフォーマットが
決まってるんなら、むしろ対応は楽なんだが。
コンピュータのチェックの精度は、
人間よりも上だし。
0304Mr.Moto
垢版 |
2018/06/19(火) 18:00:52.20
>>302
まだ箱も空けてねぇよ(w
0306仕様書無しさん
垢版 |
2018/06/20(水) 03:31:35.13
いつのまにかかな漢字変換のスレになってるw

Googleの中の人が書いたネットから言葉を集めてきて統計的漢字変換するやつの本が
面白かったね
0307仕様書無しさん
垢版 |
2018/06/20(水) 03:33:48.77
VJE-β

懐かしすぎて涙が出てくる
おれたち歳取ったなあw

言葉の活用変換って、発音しやすいかどうかでもなまってたりするから
口の開けやすさとかもモデルにしないと計算できないな
ま、そういうの面倒くさいから機械学習しちゃうんだろうけど
0308Mr.Moto
垢版 |
2018/06/20(水) 06:51:35.45
>>307
> 言葉の活用変換って、発音しやすいかどうかでもなまってたりするから
いや、音声認識や音声合成だと利いてくるけど、
表記に直すときに脳内変換してるから、文字にするとかなり規則的。
合成音声って、鼻が詰まったような声になるだろ?
あれは、声道の形の変化がブツブツに切れているのが原因らしい。
適当にスムージングすりゃあ消せないことはないんだろうけど、
制禦が難しいから、こんどは活舌が悪くなったりすると思う。
0309Mr.Moto
垢版 |
2018/06/20(水) 06:57:28.35
>>307
VJE-β というか、VJE-Pen だったそうだ。
もともと出版技術部(TEX とかやってたチーム)と
つきあいがあったんだけど、アスキーとインプレスが
分裂したら、どっちも「出版技術部がないと本が出せない」
っていうんで、宙ぶらりんになっちゃったんだよ。
で、インプレスの井芹さんにねじこんで、「日本語処理の
技術を使って、最近流行りの『ステレオグラム』を作る
技術を開発したんで、本を出させろ」っつって、
『スーパーステレオグラム』って本が出た。
0310仕様書無しさん
垢版 |
2018/06/20(水) 08:03:03.10
ゴチャゴチャうるさい
実際はosのインストールもできないバカ
そのクズの相手をするカス
0311仕様書無しさん
垢版 |
2018/06/20(水) 08:05:03.20
やっぱりサバ缶なんていらんわ
足遅
はじめの第一歩にいつまでかかっとんねんこのクズ
0312仕様書無しさん
垢版 |
2018/06/20(水) 08:33:34.45
これ一人で会話してるんでしょ?
アスペではよくあること。

常人を超える能力を発揮する天才型アスペなんてスーパーレアで、
よくいるアスペがどんなに得意分野をがんばっても常人の3割の能力を
出せればいいほう、というのがよくわかるスレだと思う。
0313Mr.Moto
垢版 |
2018/06/20(水) 09:23:16.01
>>312
> これ一人で会話してるんでしょ?
残念でした。“ここでは” 一人だよ〜ん。
社内掲示板で内ゲバ(社内検討会。社外にプロポーザル
出す前に、社内でプレゼンとダメ出しに分かれて
討論をする)やってるときは、
プレゼン側とダメ出し側の両方をハンドル変えて
やってたことはあるけどね。

> アスペではよくあること。
いやぁ、「よくあること」じゃないだろ。オンラインでハンドル変えて
やる奴は遭ったことないなぁ。それは「アスペルガー症候群」っていうより、
統合失調症とか人格障害とかの、脳内の別バーソナリティの話だろ。
それっぽいのは淡里茉莉子と有沢誠さんみたいな関係があるけど、
あれは病気じゃなくて、単なる洒落だから。
出典)有沢 誠『プログラミング・レクリェーション―ソフトウェア実習のガイド』
0314仕様書無しさん
垢版 |
2018/06/20(水) 09:29:55.41
アスペが自演する根本は統失を併病しているのかもしれないけど、
アスペが自演をしてもばれないと思っている理由は、
常識で考えられる以上に複数人の思考が同期していることに気づけない、
ところにある。
もしかすると本当に息のあった複数人かもしれないけど、他者から見て
必要以上に思考が同期している複数人は単数で脳内処理されるので
自演扱いになる。気を付けたまえ。
0315Mr.Moto
垢版 |
2018/06/20(水) 09:30:57.60
>>312
> 常人を超える能力を発揮する天才型アスペなんてスーパーレアで、
アスペでなくても「常人を超える能力を発揮する」奴はスーパーレアで、
それが「天才」と呼ばれるんじゃねぇかな?
そんな粗雑なロジック吐いてて、ちゃんとプログラム書けるのか?
0316仕様書無しさん
垢版 |
2018/06/20(水) 09:35:27.62
それだと常人の世界は天才だらけになってしまうぞ。
0317Mr.Moto
垢版 |
2018/06/20(水) 09:42:08.41
>>314
> アスペが自演する根本は統失を併病しているのかもしれない
そもそも、「自閉」というのは、認知症(昔は「痴呆症」と
呼ばれた)の症状なんだよ。
ところが、青春期に自閉症状がみられるケースが問題になって、
「痴呆症」→「老人性痴呆症」と言い換えられて、青春期に
発症するタイプを「早発性痴呆症」(現在は、「精神分裂症」を
経て「統合失調症」)と呼ぶようになったんだ。
そうしたら、ハンス・アスペルガーという人が、幼児にも「自閉」
症状が現れるというのを主張して、「幼児自閉症」→「自閉症」→
「アスペルガー症候群」と名付けられたという由来がある。
「アスペの自演」というのが「演技性パーソナリティ」なのか、
「パーソナリティの解離」なのかは、プロのお医者さんでも
診断がつくまで何か月もかかるような話だぞ? そもそも
パーソナリティ障害を診断できるというか、実際に見たことの
ある精神科医だって、比率からいうと、5パーセント以下だと
思う。
0319Mr.Moto
垢版 |
2018/06/20(水) 09:44:38.87
>>316
そうだな。誇大妄想とも言うが。
0320仕様書無しさん
垢版 |
2018/06/20(水) 09:48:56.82
契約の概念を理解できていない、請負なのか雇用なのかも自分ではわかならない、
いいように偽装請負で使い捨てされてしまう、そんな知的障害が疑われるレベル
0321仕様書無しさん
垢版 |
2018/06/20(水) 09:54:39.78
そうやって深そうで実は薄っぺらい知識をひけらかすことで
他人を騙して仕事ができそうなフリをしてきたんだろう。
1の知識をグーグルさまで3くらいに水増しして、話の中で
如何にも10知ってますかのようにアピールする。
よくあるテクニックだが、関係ないところで使ってもうざいだけだし
底が割れるのが早まるだけだよ。
0323Mr.Moto
垢版 |
2018/06/20(水) 10:02:54.11
>>320
> 契約の概念を理解できていない、請負なのか雇用なのかも
> 自分ではわからない、
それは屁理屈をこねて民法とか商法とか労働基準法とかを
遵守しないブラック企業側の問題であって、被害者である
顧客やおれの問題ではないし、おれがアスペであることとも
関係はない。

> そんな知的障害が疑われるレベル
少なくともプログラムを書くのに不自由しない程度の知能はあるぞ(w
おれより生産性が低い奴は知的障害を疑われるのか?
0325Mr.Moto
垢版 |
2018/06/20(水) 10:08:10.50
>>321
> 底が割れるのが早まるだけだよ。
「喋る馬鹿はすぐバレる」そうだが、
「そんだけ喋ってバレないんだから、馬鹿でも才能だけは
あるんだな」と言われる(w
0326仕様書無しさん
垢版 |
2018/06/20(水) 10:13:48.90
>>323
>少なくともプログラムを書くのに不自由しない程度の知能はあるぞ(w

この板には35歳というアスペがいて、こいつ自分ではすごいコードを
書いているという認識で自信満々でコード張るんだけど、毎回すごい
がっかりコードを見せられているんだ。

アスペ本人の「プログラムを書くのに不自由しない」ってのを
額面通りに受け取る奴はこの板にはいないと思うぞ。
0327仕様書無しさん
垢版 |
2018/06/20(水) 10:16:21.68
>>325
そうなのかな。
とっくに底が割れているのに、煽てていい様に使われているだけなんじゃないの?
偽装請負もその一環なんでしょ。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況