X



Namazu全文検索システム

0123nobodyさん
垢版 |
03/01/18 07:01ID:0IdKnMy1
ところで、ウチのプロバイダはCGI使えないんだけど、全文検索(Namazuじゃなくても可)できる方法ないですかね。
0124nobodyさん
垢版 |
03/01/18 15:04ID:???
>>123
あらかじめ検索用のインデックスを作っておいて、javascriptで、〜〜〜〜
0125124
垢版 |
03/01/18 15:07ID:???
よく考えたら、自分の所でCGI使えなくても、
CGIを使えるサーバーを借りたら、解決だった。
0127nobodyさん
垢版 |
03/01/18 22:45ID:KC3+f7J6
>>122
自分的にもそれは必須の機能だと思うんだけどなぁ。
頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。
メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。
0128nobodyさん
垢版 |
03/01/21 15:04ID:2m91wCEm
、、、すんません 教えて下さい。
Namazu 2.0.12 for Win32をWin98で使用しています。
mknmzを実行すると、下記のエラーが出てしまいます、、、

Can't locate File/MMagic.pm in @INC (@INC contains: . C:/Perl/lib C:/Perl/site/
lib .) at C:\USR\LOCAL\NAMAZU\BIN/mknmz line 34.
BEGIN failed--compilation aborted at C:namazu\bin/mknmz line 34.

お分かりになる方、いらっしゃっいましたら
ご教授ください。お願いします!
0129nobodyさん
垢版 |
03/01/21 23:04ID:???
MMagic が適切なパスにないか、インストールしていない。
0130nobodyさん
垢版 |
03/01/22 00:18ID:???
>129さん 早速のレス、ありがとうございます。
MMagicのインストールを行おうとすると、エラーがでるので確かにインストール
されていないようです。
namazuのパッケージに含まれてるppmは、500番台と600番台の2つなのですが
私のActivePerlのビルド番号を確認すると、804となっています、、、。
これが原因なんでしょうか?
0131nobodyさん
垢版 |
03/01/22 22:49ID:tlaGPNPQ
kabayaki使えYO!
0132nobodyさん
垢版 |
03/01/22 22:55ID:0SY2SNoc
「パソコンの仕組み」

http://pc1.moo.jp

パソコン・インターネットの仕組み、パソコン自作・サーバー構築法について、動画や静止画を豊富に取り入れて、初心者向けに基礎から分かりやすく解説しています。

ガンガン、アクセスしてください!!
0134nobodyさん
垢版 |
03/01/23 09:19ID:XTkiyicl
chasen使ってる人に質問です。
やっぱりkakasiより検索精度あがりますか?
とくにひらがな単語やカタカナ単語で。


0135nobodyさん
垢版 |
03/01/24 13:46ID:DnlSMTjH
 おまいら、namazuで検索するファイル数ってどのくらいですか?
1ディレクトリで1000ファイルオーバーとかって、インデックス
作るのに問題ないっぽい?
 なんか、毎日自動でインデックス作ってるんだけど、ちゃんと
インデックス作れてない(検索できない)場合が時々あるのよ。手動で
作ってやるとちゃんと動くところがまた憎らしい。
0136nobodyさん
垢版 |
03/01/24 15:43ID:9aIuMK5X
wgetの収集でたまにぜんぜん関係ないディレクトリに
index.htmが格納されて困るんだけどなんでだろう。
ブラウザ動かしながらやるとミスするのかなぁ。

win2k
0137nobodyさん
垢版 |
03/01/25 15:38ID:x6YUG/OM
pnamazuのほうがヒットしやすいのでしょうか?

perl版でインデックス作らないとダメなのでしょうか?

そのままのインデックスでpnamazu.cgiでとりこぼしが減るのでしょうか?
0138nobodyさん
垢版 |
03/02/05 04:47ID:vQpd3y9f
保守
0140nobodyさん
垢版 |
03/02/05 09:04ID:LQrwCDVW
アダルトの宣伝↑

ナマズの派生で、カバヤキっていうのでたけど使ってる人いる?
0142nobodyさん
垢版 |
03/02/05 10:12ID:???
初めて Namazu 使ってみたけど、SI には使いづらい作りだな…
0143nobodyさん
垢版 |
03/02/05 11:27ID:???
>>142
どこら辺が?
内容によっては、回避策や運用のテクニック教えてあげられるかも。
0144nobodyさん
垢版 |
03/02/07 03:32ID:/4XUF2iq
MS-Access + ASP の like による全文検索と Namaz でインデックス
作成した全文検索ってどのくらいパフォーマンスが変わってくるかなー

検索対象レコード:1000、検索対象フィールド:3
各フィールド60,000文字ぐらいで考えてるんだけど、
MS-Access + ASP じゃ無理あるかな・・・
2、3秒で検索結果がでてくればいいのですが・・・
インデックスの作成自体、最近気づいた愚か者ですが、
よろしくお願いいたします  m(_ _)m
0146nobodyさん
垢版 |
03/03/07 18:19ID:+bpjK8Vp
UNAGI
0148nobodyさん
垢版 |
03/03/08 16:11ID:6pWNtujS
あるファイルを処理できるフィルターが複数あるとき、
どちらを使うかはどうやって決まるのでしょうか?
0151nobody
垢版 |
03/03/28 00:40ID:???
(´-`).。oO(保守……。)
0153山崎渉
垢版 |
03/04/20 06:08ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
0154nobodyさん
垢版 |
03/04/23 13:38ID:???
うちのノートPC、2chのlog数百個程度mknmzしてると
CPU周り熱々になって九割方落ちる鬱
0157nobodyさん
垢版 |
03/05/18 02:04ID:inHKtSNs
Namazuを使ってます。
ただ、データの量が多くインデックス作成に失敗する事が多々あり、
現在は分割して、インデックスを作成。
ここに追加( --no-delete オプション)しています。
(更新は週に1回でも十分なので、本当は週に1回最初からインデックスを
作り直したいのですが、時間的にも労力的に厳しいです)

質問なのですが、上記の --no-delete オプションで一部のファイルをインデックスに
追加することと逆に、なんらかの方法で「指定したファイル」のインデックスからの
削除は可能でしょうか?
0158nobodyさん
垢版 |
03/05/18 10:06ID:OMFaVw9A
>>157
>データの量が多くインデックス作成に失敗する事が多々あり

うちではそんなこと無いなあ。まあ10万ファイル程度だけど。
データ量が多いってどのくらい?
インデックス作成失敗って、どんなメッセージが出てどんな状況になるの?
0159nobodyさん
垢版 |
03/05/18 14:25ID:???
>>158
共用サーバにてインデックスを作成、Namazuを利用しています。

おおよそ、1MB前後が1回あたりのインデックス作成の限度のようです。
メッセージは「Out of Memory!」です。
0160nobodyさん
垢版 |
03/05/18 17:53ID:???
ローカルのマシンでインデックスを作ってアップロードじゃだめなん?
0161nobodyさん
垢版 |
03/05/19 02:54ID:???
>>160
それも考えたのですが、インデックスには当然ローカルのファイルのパスが含まれてますよね?

現在はReplaceで、サーバのパス/virtual/ID/→http://〜の絶対パスに変更しています。
ローカル(Windowsマシン)C:\〜を絶対パスhttp://〜に変更させる事ができるのでしょうか?
0162nobodyさん
垢版 |
03/05/19 08:52ID:???
>>161
だって自分でやってるって書いてんじゃん。
0163nobodyさん
垢版 |
03/05/19 11:12ID:???
なんだ、結局サーバのメモリ使用量制限に引っかかってるだけじゃん。
Namazu と直接関係ないじゃん。

>>161
可能。パスを書き換えて、インデックスを再構築すればいい。rfnmz だっけ?
ml の過去ログで似たような事例を見た気がする。
0164nobodyさん
垢版 |
03/05/19 12:36ID:R1nWpNfc
NamazuってリレーショナルデータベースのIndex検索できますか?
Javaで書かれたLuceneってのはできますよ。
0166nobodyさん
垢版 |
03/05/19 14:26ID:???
>>162
>>163
ありがとうございます。

wget>インデックス作成>検索と3段階で相当な負荷が
サーバにかかっていたので、いつアカウントを止められるのか
心配していました。

wget>インデックス作成まで行えれば、
検索だけをサーバで行うので負荷も和らげられると思います。
0169nobodyさん
垢版 |
03/05/21 10:19ID:???
ローカルのWindowsのNamazuと、共用サーバのLinuxのNamazuのインデックスは
互換性があるのでしょうか?
0170nobodyさん
垢版 |
03/05/21 14:38ID:zDb/UTki
age
0173nobodyさん
垢版 |
03/05/22 01:10ID:???
>>172
ありがとうございます。

Liunxのインストールからはじめるのは辛いですし、
cgiでインデックスを作ろうとするとすぐに落ちるので
助かりました
0174山崎渉
垢版 |
03/05/22 01:58ID:???
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
0176山崎渉
垢版 |
03/05/28 17:21ID:???
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
0178nobodyさん
垢版 |
03/06/18 16:39ID:DT1VWY3V
そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?
0179nobodyさん
垢版 |
03/06/18 22:37ID:yFwDTAK+
>そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?

PHPマヌアルにかぎらずUTF8で書いてあるページは文字化けするツー事
nkfを利用しているからじゃないかな
0180nobodyさん
垢版 |
03/06/19 00:34ID:r/KT2iM+
nkf使ってないよ、lvでutf8対応している
0181nobodyさん
垢版 |
03/06/25 14:23ID:77oj5Ix9
Namazuってファイルの検索に使うんですか?
全文検索できないの?
できるんだったら、指定したキーワードを含むファイルだけから全文検索するなんて使い方も可能?

また、インストールしたLinuxとかのディスクに置いてあるファイルでないと検索できないのかな?
Windowsマシン上にあるファイルもさがせたりしないんでしょーか。

いろいろ関連サイト見てみたけどそういったことは書いてなかったYo!って探し方悪いんでしょうか

0184ミルフィーユ
垢版 |
03/06/25 15:24ID:???
カスケードスタイルシートって、
おいしそうですねぇ。
0185nobodyさん
垢版 |
03/06/25 19:36ID:???
>>181

no
no
no
no
no

調べ方悪すぎ。namazu.orgにある文章読むだけで全て分かるのに。
0186181
垢版 |
03/06/27 00:27ID:6z/IvjGb
>>185
noってそれぞれの私の質問に対する回答ですか?
いずれにしてもサンクス子 http://www.namazu.org/ いってきます。。m(。_。)m
0187???
垢版 |
03/06/27 19:27ID:1V/886pX
インデックスの作成 OK → Webサーバーへのアップ OK
→キーワード入力 OK →検索している 検索結果は出るのですが
全く関係のないページばかりリストアップ。そのページソースを検索キーワード
で探してもありません。

インデックスもエラーなくできて、アップも問題なくでき、検索もできるのですが
その結果が全くあさって・・・どこに問題がありそうでしょうか???。ご意見を
お願いします。
0188nobodyさん
垢版 |
03/06/28 01:23ID:???
>>187
Namazuってそんなもんだよ。
といいつつ、おれもインスコしてますが、自分では一切使わない。w
0189187
垢版 |
03/06/30 07:16ID:???
>>188
んっ〜それにしても結果が全く関係なさ過ぎるんですよ。
インデックスがまともに出来ていないような現象です。
ただ、作業的には問題なく進んでるんですよ・・・トホホ  。・゚(/д\)゚・。
0190 ◆MiMIZUNCjA
垢版 |
03/07/07 03:25ID:sv7ydGsI
なんどもインデックスの構築をしているといつのまにかめちゃくちゃな回答をされるときがあって
そういう場合は最初から作り直しますがなんなんでしょうね。
0191
垢版 |
03/07/07 03:54ID:???
>186
たぶん回答じゃなくて、ガイジンさんなんだよ。
...no. no! no!! no!!! nohhh!!!!!! nanimochigaudesholtu!!!
って感じだと思う。
0192山崎 渉
垢版 |
03/08/15 22:47ID:???
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
0194nobodyさん
垢版 |
03/10/06 00:26ID:MvGVNeyO
なんだか自分は複数indexについてよくわかっていません。
複数indexを作る場合、
namazu.cgiと.namazurcのあるディレクトリの下に新しいディレクトリを作って分けて、.namazurcで制御すればいいんでしょうか?
今はindexファイルをnamazu.cgiと.namazurcのあるファイルと同じ階層に全部詰め込んでいます。
これだと、二つ以上のindexは作れないみたいです。
0195nobodyさん
垢版 |
03/10/06 00:33ID:???
複数インデックスは、 インデックスのあるディレクトリ内のサブディレクトリ名が
そのままインデクス名になる。使う場合は、.namzurcではなくて
NMZ.head.jaで idxname="foo" とか指定してやればいい。
0196nobodyさん
垢版 |
03/10/06 06:50ID:fxmWtj2Y
>>195
わかりやすいレスありがとうございます。
解決しました。
0197nobodyさん
垢版 |
03/11/13 08:37ID:Tw9dU9HY
相談なんですけど、

「ホスティング依頼している鯖に namazu を入れて、メールの全文検索ができ
ないもんかな?」

という相談をうけますた。

う〜ん…………

おいらの使ったのは、RedHatだったんで、namazuはRPMでなんも考えずに
入れて、インデックス作って使ってたことはあるけど、ホス依頼してる鯖だと
root 権限なんか貰えないだろーしなぁ……

なんかいい方法ってないでしょか?
0199197
垢版 |
03/11/14 14:31ID:bYphtnKK
>>198

ありがとう!提案してみるよ

って、これ、インデックス作成はローカルの環境でするのかぁ
ま、いいや。相手がなんていうか、言うだけ言ってみよう

ヒントくれてサンクス!
0200nobodyさん
垢版 |
03/12/20 12:12ID:BT5vMVU9
特定のディレクトリのみ除外する方法は何かありますか?
0201nobodyさん
垢版 |
03/12/20 14:36ID:???
>>200
特定のファイル(拡張子だけだったかも)を除外する
という設定項目があった様な記憶があるんで、
もしかしたら、それの応用でディレクトリごと無視するとかできるかも。

#具体的にどんな設定をするかは忘れた
#多分namazuの本家サイト見たらあったよ
0202nobodyさん
垢版 |
04/01/02 23:12ID:???
自分のページは全て、「http://www.example/com/?cat=★」★はページごとに違う
という形式なのですが、
こういった動的なページに対してNamazuを使うというか、インデックスを作成するには、
どうすればいいのでしょうか?
0204202
垢版 |
04/01/04 01:18ID:LkXOe+SC
あ、すごいタイムラグあいてますね。。。age
0206202
垢版 |
04/01/05 22:28ID:???
>>205
ありがとうございます。
全部、/?cat=★は「★.inc」としてファイルをおいてあるので、それでなんとかいきそうです。
0207nobodyさん
垢版 |
04/01/19 19:55ID:daYuprPN
教えてもらいたいことがあるんですが
nmz.field.****
の****を増やしたいのですが、どうしたら良いでしょうか?

具体的にはmknmz時にuriを見て
wwwroot/aaa/a.html
wwwroot/bbb/b.html
nmz.field.locate ってファイルを作ると
その中に
aaa
bbb
って出力されてほしい
で検索結果でyahooのカテゴリのように
<a href="a.html">aのタイトル</a>
カテゴリ TOP>>aaa(${locate}の値)とかやりたい
まぁ検索結果の中でuri見て変換したら良いんだけど、
もうちっとスマートに処理させたいなと・・・
0209nobodyさん
垢版 |
04/02/11 00:01ID:???
Namazuで検索サイトやろうかな。
0210nobodyさん
垢版 |
04/02/13 03:38ID:jCzy8g3E
質問です。
2chの過去ログを検索出来るようにしていますけど
ファイル数17万程度でインデックス作成に取り組んでいるのですけど
3日経っても終わりません。。おかしいと思いこちらに来ました。
もっと処理を早くしたいのですが、、

一応何を書けばいいのかわかりませんが、
PCのスペック等を簡単にまず記します。
何か必要な設定項目を書けと言われればすぐ書きますので、、
CPU P3-1G@dual
mem 1G
namazu ver2.0.12
perl 5.6

設定ファイルの中身を弄ればいいのでしょうか。。
一応インデックス書き出しは行われ続けていますけど
遅くて遅くて、、、
何かヒント等くれる方いらっしゃいませんでしょうか、、、?
0211210
垢版 |
04/02/13 03:45ID:jCzy8g3E
OS windows2000 sp3
KAKASI使用

mknmzrc設定
$ON_MEMORY_MAX = 5000000;
$FILE_SIZE_MAX = 10000000;
$TEXT_SIZE_MAX = 1000000;
$WORD_LENG_MAX = 128;
$INVALID_LENG = 128;
$MAX_FIELD_LENGTH = 200;
$WAKATI = $KAKASI;

とりあえずon memory maxの値が小さいのはわかったのですけど
これが速さに関係するのかは理解出来ませんでした。
また、他に問題点や気づく点等がありましたら教えて欲しいです、、
0212nobodyさん
垢版 |
04/02/13 08:37ID:???
処理能力にはディスクI/Oという重要なファクターもある。
一気にmknmzするのではなく、分割してmknmz→マージする。
そうすれば処理時間もだいたい想像できる。
0213210
垢版 |
04/02/13 13:43ID:wO1Lum8s
>>212 ヒント有難う御座います!
   少しそれについて調べてみます。
0214森の妖精さん
垢版 |
04/02/16 02:31ID:/mo58UcM
http://geta.ex.nii.ac.jp/

GETAのPHPインタフェイス作ろうという奇特な御仁は
いらっしゃいませんか?
0217nobodyさん
垢版 |
04/03/31 21:28ID:???
Namazuでインデックス化をして検索をしようと思ったら
「現在-3の文書がインデックス化され、・・・」と文書の数がマイナスになっています。
どうしてなのでしょうか。
0218nobodyさん
垢版 |
04/03/31 21:46ID:5e+SzBpf

0219(´・ω・`)
垢版 |
04/04/01 21:05ID:98Q5EoMa
どなたかPHPスクリプトで動く
日本語全文検索エンジンソフトウェアを教えてください。
0220nobodyさん
垢版 |
04/04/02 00:02ID:n5mwBUCQ
4/1にNamazuの新バージョン出るんじゃなかったっけ?
0222nobodyさん
垢版 |
04/04/20 23:55ID:hVBcQucn
Namazu 2.0.13-1 を公開age
0223nobodyさん
垢版 |
04/05/01 23:15ID:HE2QfFBX
kakasiについて質問です。

自分で作った辞書を、追加した。

# mkkanwa kanwadict (追加した辞書ファイル)

自分で追加した辞書の内容は、
上記の場合、(追加した辞書ファイル)を参照すれば分かるけど、
現在の辞書全体にどのような単語が登録されているかを調べるにはどうしたらいいんでしょうか?

kanwadictって、viで開くと文字化けして見れません。
※環境:UNIX
レスを投稿する


ニューススポーツなんでも実況