【全文検索】groonga【senna後継】

55 · 2012/05/24(木) 21:16:26.25

>>72-73
対応してるんだ。ありがと。

**nobodyさん** · 2012/05/30(水) 13:28:02.35

queryのエスケープ処理のカオスっぷりハンパねーな

**nobodyさん** · 2012/06/01(金) 16:29:26.89

mroongaテーブルで全文検索はうまくいくんだけど、
プライマリキーでの検索がちゃんとヒットしない
バージョンは1.3.0
俺だけ？
こんな単純なところで引っかかるとは・・

**nobodyさん** · 2012/06/01(金) 19:31:21.57

プライマリキーも全文検索の対象にしてるの？

プライマリキーでの全文検索ってのはできるのかな・・・
オートインクリメントのカラムを別途用意してそっちをプライマリキーにしたほうが安全だと思うが・・・

**nobodyさん** · 2012/06/01(金) 22:44:27.99

プライマリキーは全文検索の対象にしてないよ
varchar型の数文字の文字列
where id='hoge'
みたいにやっても何故かヒットしない。
最近バージョンにしようと思ったけど、何回やっても
Can't open shared library 'ha_mroonga.so' (errno: 0 API version for STORAGE ENGINE plugin is too different)
って言われる
インストールされてるパッケージは

groonga-tokenizer-mecab-2.0.3-0
groonga-release-1.1.0-0
groonga-plugin-suggest-2.0.3-0
groonga-2.0.3-0
groonga-libs-2.0.3-0
mysql-mroonga-2.03-0
MySQL-client-5.5.23-1.rhel5
MySQL-server-5.5.23-1.rhel5

いやこれ全部最新版だよね
もう疲れたよパトラッシュ

**nobodyさん** · 2012/06/02(土) 02:12:33.64

groongaのバージョン戻して、
プライマリキーを削除したら検索可能になった
それで普通のINDEXなら張り直しても問題ない
原理は不明だけど

**nobodyさん** · 2012/06/02(土) 20:56:24.77

昔はVARCHAR型プライマリキーの扱いに問題があったけど
最新バージョンでは大丈夫になってるはずだけどなぁ

**nobodyさん** · 2012/06/03(日) 00:04:53.44

最新バージョンはうまく入らなかったから戻したんだよ

**nobodyさん** · 2012/06/03(日) 02:47:33.61

>>78
yumで入れた場合MySQLとmroongaのバージョン気をつけないとそんなことになった気がする
mroongaソースから入れたらいいよ

**nobodyさん** · 2012/06/09(土) 20:25:01.76

MySQL-server のversion が 5.5.25-1.rhel5 にup されたね
おかげで、yum でmysql-mroonga が入るようになった

**nobodyさん** · 2012/06/11(月) 17:37:37.24

知っている方が居たら教えて頂きたいんですけど、
今、likeで部分一致を使って検索しているシステムを
全文検索に置き換えたいと思ってます

そこでmroongaを試して居たのですが…
「駅」とかで検索した時に、TokenBigram(デフォルト)だと引っかからず
対策としてTokenUnigramにしました

TokenUnigramにする事で、「駅」は解決したのですが、
今度は「BOX」がどうにもならず…
データにINBOXとかがあり、これが引っかからない…

mroongaで「駅」と「BOX」を両立させるうまい手は無いでしょうか

今の環境は、CentOS 6.2でmysqlは5.1.61, mroongaは2.0.3です
全部yumで入れました

**nobodyさん** · 2012/06/11(月) 21:09:03.26

ngramのがはやそげ

84 · 2012/06/15(金) 19:58:43.63

結局、
TokenBigramSplitSymbolAlphaDigitで
?mroonga_match_escalation_thresholdを1にして
検索かけたら上手く行った

**nobodyさん** · 2012/09/29(土) 19:02:59.77

WindowsServerでTritonn使ってます。
システムの移行を考えてて、groonga試したいんだけど、
MySQLのプラグインとしてgroongaを使うのはWindowsでは
できませんか?
導入手順ご存知の方がいらっしゃったら教えてください

**nobodyさん** · 2012/10/06(土) 18:26:42.81

ここ見たのか知らないけど、今ここでWindowsでも使えるように頑張ってるみたい
10月の後半ぐらいには使えるようになるんじゃね？
http://redmine.groonga.org/issues/1496

87 · 2012/10/07(日) 11:14:16.58

>>88
現在開発中なんですね。
気長に待ちます。

**nobodyさん** · 2012/10/23(火) 17:43:15.04

debパッケージからgroonga-server groonga-server-commonがなくなっているような…

**nobodyさん** · 2012/10/23(火) 17:46:46.15

groonga-server-gqtpに名前が変わったのか

**nobodyさん** · 2012/10/29(月) 16:07:31.55

groonga-httpdに
curl http://localhost:10041/d/status
とかすると405 not allowedになるんだけどどうすりゃいいの

nginx関連で405で調べるとpostした時のことばかりだし

groonga内包のhttpの方は、shutdownで帰ってこない
gqtpの方は問題ないんだが…

疲れた

**nobodyさん** · 2012/11/13(火) 18:26:33.67

groongaをhttpで起動し、
http://localhsot
にブラウザでアクセスしたら、
groongaのCPU使用率が100%になって、
応答なし状態になるんだけど、
何が悪いんでしょうか。

以下のコマンドを順番に実行しただけです。
ttp://groonga.org/ja/docs/tutorial/network.html#hypertext-transfer-protocol-http
ttp://perl-users.jp/articles/advent-calendar/2011/casual/4

Windows8と2008ServerR2の
両方で再現...

素直にLinux使うべき？

**nobodyさん** · 2013/03/14(木) 17:15:20.37

mroonga2.04->3.01に変えたら
Insert時にgroonga.logに
invalid utf8 string(2) on grn_str_charlen_utf8
が出るようになった・・・
文字コード照合順序はDBも、テーブルも、全文検索用インデックス設定してるカラムも
全部utf8_general_ciにしてる

全文検索の結果も同じ単語で今まで引っかかってたものが
半分くらいしか引っかからなくなってたり、、インデックスが壊れてる？

**nobodyさん** · 2013/03/14(木) 17:16:26.58

mroonga2.04->3.01に変えたら
Insert時にgroonga.logに
invalid utf8 string(2) on grn_str_charlen_utf8
が出るようになった・・・
文字コード照合順序はDBも、テーブルも、全文検索用インデックス設定してるカラムも
全部utf8_general_ciにしてる

全文検索の結果も同じ単語で今まで引っかかってたものが
半分くらいしか引っかからなくなってたり、、インデックスが壊れてる？

**nobodyさん** · 2013/05/10(金) 16:34:31.53

なんか、grn::dat::Trie::open failedって出るようになってしまってgroongaエンジン系全滅なんだけど。
どうやって復帰すりゃええんですかいの？

**nobodyさん** · 2013/05/10(金) 20:53:30.15

あ、mysql上なのでmroonga使ってますた
。
結局データの復帰はならず、一時ファイル的なものなので全抹消とあいなりました。
試したこと一覧

・UNINSTALL PLUGIN、INSTALL PLUGINを実行　→　変化なし
・clearlockを実行（データファーいるの場所がわからず全体に対してclearlock）　→　変化なし
・drop table → エラーで動かず
・UNINSTALL PLUGINを実行してからdrop table　→ テーブル自体は削除OK
・同じDB上でもっかいmroongaエンジンのテーブル作成 → 同様のエラーで作成できず
・DBを変更してmroongaエンジンのテーブル作成 → OK
・現行バックアップできるテーブル（非mroongaエンジン）を退避して、drop database → OK
・DBごと再作成 → OK

もうちょっとスマートな解消方法あったんですかね？
スレチだったらごめんなさい。

**nobodyさん** · 2013/05/10(金) 20:54:18.17

oh... IDが変わってるけど>>96です。
ちなみに途中でgroonga及びmroongaは1.0.xから3.03にアップデートしますた。

**nobodyさん** · 2013/05/10(金) 21:57:12.05

続報
同名DBを作成しなおして同名テーブルを生成し直すとエラー
当然っちゃ当然ですね。

というわけで、DBをもう一回削除しなおした後、mysqlのdataディレクトリ中のmrnファイルをごっそり削除したところエラーは回避。
なんとも不安定な仕組みなもんだね。mroongaは

96 · 2013/05/11(土) 13:25:32.41

3.03に切り替えたからか、そもそも不安定なのか、mroongaのupdateがフリーズ（？）するようになってしまった・・・。

**nobodyさん** · 2013/05/31(金) 04:55:23.95

windows用のmroongaをダウンロードしたいのですが、
ファイルがnot foundになります
http://packages.groonga.org/windows/mroonga/
ここを見るとファイルが一つもありません
何故ですか

**nobodyさん** · 2013/05/31(金) 04:59:57.68

トリトン使うことにしますた

**nobodyさん** · 2013/06/01(土) 00:02:56.00

>>101
http://mroonga.org/ja/docs/install.html#windows

**nobodyさん** · 2013/06/01(土) 00:08:19.27

>>103
not foundには変わりないけど・・どういう意味ですか？

**nobodyさん** · 2013/06/01(土) 00:22:35.73

>>104
ごめんなさい。確認するの忘れてた…

**nobodyさん** · 2013/06/01(土) 00:46:50.58

MLでWin版のテスト募集されてましたよ。
http://sourceforge.jp/projects/groonga/lists/archive/dev/2013-May/001410.html

**nobodyさん** · 2013/08/31(土) NY:AN:NY.AN

隔週連載groonga
http://gihyo.jp/dev/clip/01/groonga

http://qiita.com/groonga

**nobodyさん** · 2013/09/11(水) 20:24:29.01

頻発にテーブルupdateすると壊れるからマジで使えない

**nobodyさん** · 2013/10/22(火) 16:49:55.87

mroongaでカンマ区切りでインデックスさせるにはどうしたらいいすか？

**nobodyさん** · 2013/11/22(金) 17:20:10.93

>>92
64bit版にしたら全く問題なかった

**nobodyさん** · 2014/01/05(日) 03:05:09.06

mroongaとして使ってて、導入コストも低いし性能も問題ないんだけど
何の前触れもなく検索が遅くなったりするのが怖い

**nobodyさん** · 2014/02/05(水) 10:56:52.51

groonga のテーブル定義がさっぱりわかりません。
例えば wikipedia のデータをストアしたい場合、
どーすればいいのでしょうか？

**nobodyさん** · 2014/02/07(金) 09:34:56.28

groonga-dev のメーリングリストで教えてもらったから勝手に転載するわよ！

# <field name="id" type="string" indexed="true" stored="true" required="true"/>
# Groongaではレコードを一意に識別する値はキーとして扱う。
# 必須。required="true"相当？
table_create Articles TABLE_PAT_KEY ShortText
# <field name="title" type="text_ja" indexed="true" stored="true" required="true"/>
column_create Articles title COLUMN_SCALAR Text

**nobodyさん** · 2014/02/07(金) 09:36:19.44

# <field name="revision" type="int" indexed="false" stored="true"/>
column_create Articles revision COLUMN_SCALAR Int32
# <field name="user" type="string" indexed="true" stored="true"/>
column_create Articles user COLUMN_SCALAR ShortText
# <field name="userId" type="int" indexed="false" stored="true"/>
column_create Articles user_id COLUMN_SCALAR UInt64
# <field name="text_ja" type="text_ja" indexed="true" stored="true" required="true"/>
column_create Articles text_ja COLUMN_SCALAR Text
# <field name="timestamp" type="date" indexed="true" stored="true" default="now" multiValued="false"/>
# default="now"相当の機能はありません。
column_create Articles timestamp COLUMN_SCALAR Time

**nobodyさん** · 2014/02/07(金) 09:37:39.49

# ↓のtype="string"の転置索引用の語彙表:
# <field name="id" type="string" indexed="true" stored="true" required="true"/>
# <field name="user" type="string" indexed="true" stored="true"/>
# Bigramでトークナイズする。
table_create Terms TABLE_PAT_KEY ShortText --default_tokenizer TokenBigram --normalizer NormalizerAuto
# indexed="true"に相当。
column_create Terms articles_text COLUMN_INDEX|WITH_POSITION|WITH_SECTION Articles _key,user

# ↓用の転置索引用の語彙表:
# <field name="title" type="text_ja" indexed="true" stored="true" required="true"/>
# <field name="text_ja" type="text_ja" indexed="true" stored="true" required="true"/>
# text_jaに相当するのは--default_tokenizer TokenMecab。
table_create JapaneseTerms TABLE_PAT_KEY ShortText --default_tokenizer TokenMecab --normalizer NormalizerAuto
# indexed="true"に相当。
column_create JapaneseTerms articles_text COLUMN_INDEX|WITH_POSITION|WITH_SECTION Articles title,text_ja

**nobodyさん** · 2014/02/07(金) 09:38:53.27

# ↓用の転置索引用の語彙表:
# <field name="timestamp" type="date" indexed="true" stored="true" default="now" multiValued="false"/>
# カラムに入っている値（タイムスタンプ）そのものをトークンとして使うので
# トークナイザーは指定しない。
# キーの型をTimeにしてArticles.timestamp（トークンの型）とあわせることがポイント。
table_create Times TABLE_PAT_KEY Time
# Articles.timestamp用の転置索引の定義。indexed="true"に相当
column_create Times articles_timestamp COLUMN_INDEX Articles timestamp

**nobodyさん** · 2014/02/07(金) 09:41:18.24

難しいだわさ。

**nobodyさん** · 2014/02/07(金) 15:45:35.46

groongaは一部中国語に対応してるみたいだけど、拡張すればその他の言語もいけるのかな

**nobodyさん** · 2014/11/09(日) 23:44:24.91

おまんもーす

**nobodyさん** · 2015/02/08(日) 14:09:10.77

Droonga最新版 (1.0.9) がUbuntuにもCentOSにもインストールできなくなってしまった

更新も止まってるし、そろそろ見切りを付けて移行したほうがよさげかな？

使い始めたときの思惑と違って分散処理が不要になったから
素のGroongaでもよさそうだけど、簡単に移れるものなのかな・・・ﾄﾞｷﾄﾞｷ

**nobodyさん** · 2015/02/08(日) 14:10:21.74

正確にはUbuntuではインストールできない
CentOSではselectが実行できない
Debianは試していない

**nobodyさん** · 2015/02/08(日) 16:58:58.79

無事、素のGroongaに移行完了（データは移行中）

Droongaなんていらんかったんや！

**nobodyさん** · 2017/12/30(土) 14:51:11.75

誰でも簡単にネットで稼げる方法など
参考までに、
⇒　『半藤のブブイウイウレレ』というサイトで見ることができます。

グーグル検索⇒『半藤のブブイウイウレレ』

B2BGME4RW2

**nobodyさん** · 2019/04/14(日) 11:26:17.58

何故ぐーぐるとかの方がローカル検索より早いの
ぐーぐる1回検索する電力でコーヒー2杯のめるんだっけ？

**nobodyさん** · 2020/02/11(火) 15:32:53.10

チエオクレのハゲの悲惨なツイッター
https://twitter.com/aphonedollar

　　↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑
この自称「ハゲ」とかいうチエオクレのブログが酷すぎる

＞「DesktopHE」はWindows10に対応してないらしい

はぁ？？？　★★★大嘘デタラメ★★★を垂れ流すな！！！

■「DesktopHE」はWindows10でも、もちろん使えるわ！！！■
■「DesktopHE」はWindows10でも、もちろん使えるわ！！！■
■「DesktopHE」はWindows10でも、もちろん使えるわ！！！■
■「DesktopHE」はWindows10でも、もちろん使えるわ！！！■
■「DesktopHE」はWindows10でも、もちろん使えるわ！！！■

チエオクレのこのハゲが、Javaの設定を失敗してるだけじゃねえか！！！
嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか！

hatenaとかでまで、必死こいて大嘘をばらまいているんだが　　
https://twitter.com/5chan_nel (5ch newer account)

**nobodyさん** · 2021/12/16(木) 02:58:43.93

http://ueruku.blogspot.com/2017/03/groonga.html

この記事ワロタわ
日本人が作ってて情報発信してるはずなのにわかりやすい情報がまったくないよなgroongaさん
企業向けだとかターゲットが相当狭いんだろうな
namazuとかhyperestraier難民とかそれなりにいたはずなのに
ユーザー獲得する気まったくない
windowsでコマンドラインまともに動かんし