X



組み込み型全文検索エンジンSenna
0003nobodyさん
垢版 |
2005/06/15(水) 00:16:17ID:nYzPplAZ
…で、どうやって入れたらいいねん
誰か教えてくれ!
0005nobodyさん
垢版 |
2005/06/15(水) 05:04:00ID:I3ZAfTjX
これはもしかして
今のところRubyのみ?
0006nobodyさん
垢版 |
2005/06/15(水) 07:36:18ID:???
PerlとMySQLのバインディングもあるよ。
はてなで使ってるのはそれか、さらにカスタムしてるかも。

すごい使い勝手はよさそうなんで、PHPとPostgreSQLのバインディングもよろしく。<ブラジルの中の人
いざとなれば、他のPECLの見様見まねで自分でPHPバインディングつくるかも。
0007nobodyさん
垢版 |
2005/06/15(水) 13:39:14ID:???
GPLのライブラリはPHPライセンスと衝突するからまずいという議論が
php-dev であったよ。それで Rast のモジュールもお蔵入りになり、
namazu も pecl から撤退した。
0008nobodyさん
垢版 |
2005/06/15(水) 15:22:53ID:???
やっぱりGPL絡みで本家に期待するのは難しいですね。
自分でコソーリ作ってコソーリ使うか。

Namazuは将来libnmzをLGPLにするという話があるみたいだけど
分かち書きインデックスの精度に限界を感じてるので、それでPECL復帰しても使うかは微妙。
RastかSennaがいいなあ。

しかしEstraierも含め国産全文検索エンジンは何で揃いも揃ってGPLなんだろ。
コアがLGPL/BSDLで、フロントエンドの実装がGPLなら、ぐっと使いやすくなるのに。

# Namazuを引き合いに出すけど、わざわざLGPL版を書き起こさなくてもソースコードの著作権者が
# 「LGPLにライセンス変更です」って宣言すればいいだけと思う。
0009nobodyさん
垢版 |
2005/06/15(水) 16:32:48ID:???
Estraier はコアのLGPLであるところのQDBMライブラリのGPLな全文検索
フロントエンドな訳だけどね。
モジュールが書ける腕なら同等機能を作るのは問題ないはず。ソース見てみ。

Rast も XMLRPC 経由で使えばライセンス問題は起きないから、
仕様が公開されれば php からも使えるでしょ。

あと、Estraier の次バージョンの HyperEstraier はライブラリ形式で LGPL。


著作権者って送ったパッチが取り込まれた奴全員だよ?
一人でもヤダっていったらダメな訳だし、そもそも連絡取れないとおもう。
0011nobodyさん
垢版 |
2005/07/03(日) 21:05:39ID:???
>>8
まだ見てるかな。
Rast がライセンス変更になったよ。BSDライクな奴だってさ。
そんで、phpモジュールも公開再開だって。

個人的には、そろそろ公開されそうなHyperEstraierのノードAPIに
期待してるわけですが。
0012nobodyさん
垢版 |
2005/07/06(水) 14:14:43ID:???
sennaもLGPLになりましたよ
0013nobodyさん
垢版 |
2005/07/07(木) 14:39:25ID:???
APIを見ると、文書の属性は保存できないんだね。
まぁべつのBDBなりなんなりに入れろということか。

文書管理の面からすると、RastとかHyperEstraierに比べてそのへんが面倒?
逆に文書管理に縛られずに自由にいろんなアプリに組み込めるのがいいところなのかな。
0014nobodyさん
垢版 |
2005/12/08(木) 05:44:00ID:???
独自パッチバージョンのMeCabが必要という時点で、
お試しで軽く触ろうという意欲が無くなるな。
sennaにしか効果ないパッチじゃなく、MeCab全体に役立つパッチとして
MeCab公式に取り込んでもらいたいところだな。
0015nobodyさん
垢版 |
2005/12/18(日) 21:36:06ID:RgxCfVuV
使ってみるか
0016nobodyさん
垢版 |
2006/02/15(水) 19:47:18ID:ZxB9YIqX
保守
0017nobodyさん
垢版 |
2006/02/16(木) 17:00:42ID:i7JO7WUs
>>14
MeCab0.9で取り込まれたっぽいからpatchはもういらないぽ
0020nobodyさん
垢版 |
2006/06/22(木) 15:24:11ID:+CxY78Dt
MySQLバインディングのところ、
「skipmode-patchについてはここでは触れません。」
って書いてるけど、
どこで触れてるの?
0022nobodyさん
垢版 |
2006/06/22(木) 21:44:13ID:???
なんでこのスレ書き込み少ないん?
普通に便利だと思うんだが…
0023nobodyさん
垢版 |
2006/06/23(金) 15:51:45ID:???
>>22
使用する機会が少ないから。

ホームページならGoogleでいいし、blogなどの検索機能でも十分だし。
それ以外ではSQLのlike検索で十分なパフォーマンスになる程度の量しかない。
0024nobodyさん
垢版 |
2006/07/30(日) 14:02:34ID:zmnCWUN9
PHPでSennaを使ってHTMLを検索するときに、インデックス生成はどうやってやればいいんでしょうか?
MySQLを使用したものしか製作したことがないので…
0027nobodyさん
垢版 |
2006/08/03(木) 22:25:33ID:???
>>22
Mysqlの全文検索がUTF8対応だからじゃないかな
N文字でも分かち書きでもいいけどとにかく適当に分割してやれば日本語でも検索できる
じゃあSennaって?ていう感じじゃないだろうか
0028nobodyさん
垢版 |
2006/08/19(土) 12:09:09ID:???
っていうか2ch絡みの企業の製品なんて使いたくもない。
0029nobodyさん
垢版 |
2006/11/01(水) 16:19:47ID:???
Lucidaって中身sennaだったんだね
0030nobodyさん
垢版 |
2006/11/01(水) 19:41:42ID:???
それをいうならLudiaだろ・・・
0031nobodyさん
垢版 |
2006/11/02(木) 19:03:56ID:???
>>http://pc8.2ch.net/test/read.cgi/php/1157467026/382
>382 名前:nobodyさん sage 投稿日:2006/10/05(木) 14:59:05 ID:???
>MySQLならMeCabとかで分かち書きして、UTF-8でFULLTEXTに放り込む手もある。


こんな事を書いてたら某所で取り上げられてて驚いた。(適当に要約し引用)
>MySQL&PostgreSQLの全文検索は転置インデックスだが、Sennaは完全転置インデックスを採用している。
>完全転置インデックスの採用によって、Sennaはフレーズ検索する事ができる。

>>27
フレーズ検索に対応ってのは結構大きなポイントだねぇ
0034nobodyさん
垢版 |
2007/02/23(金) 18:48:38ID:YFrEMN+P
1.0完成記念age!
少し前の使ってるけど
入れ直した方がいいのかな?
0036nobodyさん
垢版 |
2007/02/24(土) 21:56:13ID:5ktSNz/w
>>34
入れなおして、インデックスを作りなおすといいかも。
安定性が増している・・・はず・・・
0037nobodyさん
垢版 |
2007/02/28(水) 00:12:15ID:???
phpバインディングまだぁ?

この前、ぐにゃらくんが PHP extensionの書き方勉強してるっていうんで
期待してたのだけれども。
0038nobodyさん
垢版 |
2007/02/28(水) 02:15:14ID:???
>>37
rm -rfで書き途中のヤツを消してしまった。
今は書き直して、basic APIまでできてる。
0039nobodyさん
垢版 |
2007/02/28(水) 02:27:09ID:???
大量のデータをDBも使わずにいじるケースが想像しにくいんだけど
PHPバインディングってどういう用途で使うの?
0040nobodyさん
垢版 |
2007/02/28(水) 03:35:07ID:???
>>39
んだ。特に今のSennaはストレージを持っていないから、
ドキュメントの更新は古いドキュメントの内容を渡さないといけない。
となると、実用的なアプリを書くとなると、
やはりBDBとかsqliteに別途ドキュメント情報を持っておく必要があると思うんだけどなあ・・・
0041nobodyさん
垢版 |
2007/03/01(木) 02:30:02ID:URZ8Y8TX
>>37
というわけで、作り方だけ公開してみた。
地味にAPIを増やしていく予定。
0042nobodyさん
垢版 |
2007/03/02(金) 00:18:50ID:???
現在PHP+MySQLでシステム運用してるけど、もしも導入が超簡単なら導入したい。
例えばsennaのファイルをどっかに置いて、ちょこっと設定ファイルをいじるだけでOK、とか。
それも現在のシステム構成に影響出さずに導入できるなら・・・

それならお金出してでも導入したい。
3万までなら出す。
0044nobodyさん
垢版 |
2007/03/02(金) 02:20:15ID:???
パッケージソフトとして3万ならそこそこ高価だろ。
別にたいした規模のソフトじゃないし。
0045nobodyさん
垢版 |
2007/03/02(金) 11:48:55ID:???
>>42
うひひ。果報は寝て待て。
>>44
オープンソースなので、勝手にrpm作って売ってもOKですよ。
0046nobodyさん
垢版 |
2007/03/03(土) 01:28:23ID:???
>>45
>オープンソースなので、勝手にrpm作って売ってもOK

訴えられても知らんよ・・・
0047nobodyさん
垢版 |
2007/03/03(土) 01:39:49ID:???
訴えられるわけないだろw
元からそういうものなんだから
0048nobodyさん
垢版 |
2007/03/03(土) 01:53:16ID:???
>>47
じゃあ、お前が売れば?

オープンソースの定義・概念や意味を本当に理解しているのなら、ね。
0049nobodyさん
垢版 |
2007/03/03(土) 09:52:29ID:???
>>42
MySQLのリビルドが必要だから超簡単とは言いづらい.
dump→リビルド→データ流し込むの作業が簡単かどうか.

LudiaはPostgreSQLのリビルドの必要なく組み込めるらしい.

>>49
NTTデータ社員乙
0050nobodyさん
垢版 |
2007/03/03(土) 16:33:11ID:???
>>49
>dump→リビルド→データ流し込むの作業が簡単かどうか

どっちって言うと、超難しい&めんどくさい。
dumpと流し込みはいいとして、リビルドってのが激しくイヤだ。
絶対に何かトラブルが発生するのが目に見えている。
0051nobodyさん
垢版 |
2007/03/03(土) 17:00:23ID:???
>>50
だったら何もしないのがいいと思うYo!
0052nobodyさん
垢版 |
2007/03/03(土) 18:42:15ID:???
>>51
うん、だからもっと簡単に導入できるソリューションが出るまで我慢する!
レスを投稿する


ニューススポーツなんでも実況