検索エンジンつくりたい
17才の高校生です。
無料スペースつかってCGIを使った検索エンジンつくりたいのですが
ガキなんでまったくなにもわからないので教えてほしいのですが。
詳しいひといませんか?
初めまして、エロイ人です。
仕事で検索エンジンの作成やチューニングもやっています。
何を聞きたいのですか? なんで>>1みたいな糞がちょくちょく現れるのかなぁ >>1
なにもわからないやつには無理。
基本的なことを学んでから出直して来い。 >>4さんが毎日排泄するように
日夜を問わず製造されているのでは無いでしょうか? >>5
そういう排他的な考えではいけませんね。
何事も最初は知識0から始めるものです。
まず検索エンジンとはどういう仕組で成り立っているのか考えてみては如何でしょうか?
仕組みを分割していくと幾つかに分類できていくことができると思います。 >>7
失礼しました。
リンクをはるのを失念していました。 >>2
えっと、具体的にはYomi-Searchみたいなのをやりたいんですけど、
まったくわからないんです。
どうしたらいいんですか? Yomi-Searchのソースは配布されてますよね。
それをダウンロードして中を見ても、全く分からないということですか?
分からない原因は何でしょうか?
perlで書かれているがperl自体を知らないというのであれば、
perlを勉強するのが一番でしょう。
perlは知らないが他の言語なら分かるというのであれば、
perlのリファレンスを見つつ他の言語に書き直してみるのもいいかも知れません。
言語なんてどうでもいいんだ、オレはディレクトリ型サーチが何を目指しているのか知りたいんだ、
という場合は哲学への道を進んでみるのも手だと思います。
>>1に作りたいとあったので、まずperlなりphpなり必要な手段(言語)を身に付けるところから始めてみては如何でしょうか? 誰も書いてないから書くけど、共有サーバを使うのはやめようね。
ホームディレクトリ(ここでは public_htmlディレクトリとします)の下に、「naviディレクトリ」を作成し、さらにその下にロックファイル用ディレクトリの「lockディレクトリ」を作成します。
全体のディレクトリ構成とファイル位置の設置例は以下のとおりです。(かっこ内はパーミッションの設定値)
【構成例】
public_html / index.html (トップページ)
|
+-- navi / navi.cgi [755]
| navi.log [666]
| jcode.pl [644]
| bkup.dat [666]
| A.bak [666]
| B.bak [666]
| C.bak [666]
| new.gif
| recom.gif
|
+-- lock [777] /
↑これがよくわかりません。だれか教えてください。 なるほど。yomi-searchは内部が複雑なので
簡単そうなCOSMO NAVIで来ましたか。いい選択です。
さて本題ですが、「これ」というのはパーミッションのことでしょうか?
単純にアップロードすれば表示されるHTMLと違い、
CGIの場合はプログラムを実行した結果を表示します。
そのための準備の一つにパーミッションの設定があります。
面倒なので略。 ◎CGIのご利用方法
CGIを利用される場合には、cgi-binというディレクトリを作成し、その中に
CGIを設置してください。拡張子は必ず.cgiとし、属性を700にしてくだ
さい。PerlのPATHは /usr/bin/perl となります。
HTMLファイルからCGIを参照する場合は次のように指定してください。
/blcs/cgi-bin/CGIファイル名
↑なんかマニュアル通り設定だとダメみたいなんですけど、どうすればいいのでしょうか。。。 >>20
こども相手にあんまキツイことをいってもアレだろw >>1が高校3年生「たけし」でも、そのやさしさでレス出来たかな? つーか、スレ違いだろうが単質だろうが相手にする教えたがり厨がいるよな >>23
なんで、男にやさしくしなきゃならんのだ?
/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
/基礎的な知識がやや不足気味のような気がします。
∧_∧ / 参考になるような本を一冊読み終わってから始めてみては如何でしょうか?
( ・∀・)< Web上の情報としては、yahooの
( 建前 ) \ トップ > コンピュータとインターネット > インターネット > WWW > CGI
| | | \カテゴリが参考になると思います。
__(__)_)______________
( _)_)
| | |
( 本音 ) / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
( 。A。)< 即実装の話に入れるたけし君カモーン
∨ ̄∨ \_______________ いい感じの意味が曖昧ですね。
がんがってください。 マジな話、検索ページをHTMLで生成される
検索エンジンが欲しいのだが、そういうのって可能?
製作するならぶっちゃけいくら必要になる? 打ち捨てられたこのスレへようこそ。
幾つか確認させてください。
検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
>>30
検索されるたびにキャッシュしていくとか
あんまり意味ない気がするんだが >検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
>つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
Googleは、これをやっているのでは? でなきゃ、なんで
あんなに速いんだ? HTMLページの表示にどれだけ時間がかかるっていうんだよ
検索結果の一部はキャッシュしてるだろうが、ページの生成は
動的だろ >>32
Googleのでータベースはメモリ上に常駐してるって聞いたが >>30
まぁ、そういう事ですかね。
普通のフリーの検索エンジンCGIなら
登録画面や検索結果表示画面は.cgiになります。
が、表示の速さやエラーの問題もあって.htmlである必要があるのです。
というわけでマジ見積もりお願いします。 想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくのは無理
-----end >>35
>登録画面や検索結果表示画面は.cgiになります。
HTMLにすりゃいいじゃん >>37
それをできるかどうか聞いているのですが。
それともJavascriptかなにかで代用することを
言いたいのですか? >>38
例えば2chの板にindex.「html」が表示されるでしょ?
カキコするとbbs.cgiにPOSTするでしょ?
そしたらそのカキコがまたindex.「html」に表示されるでしょ? >>39
まぁ、形はどうあれ登録サイトがhtmlで表示されていればいいんです。
あなたがそういう形式の検索エンジンを作成できるなら
だいたいいくらで請け負うか教えていただけませんか?
参考にしますので。 >>41
返事遅れてすみません。。
1万が目標です。現在600です。 >>42
カテゴリ分けしてるYahooみたいなのとは違うの?
つーか、確認しときたいけど拡張子がhtmlのcgiを作ってくれって事じゃないよね?
それなら.htaccessいじくりゃすむ話・・・・
登録の単語は手動で行なうのかな?
例えば、俺があるサイトの管理人で、その登録をしようとする。
その時に、
1.サイトのアドレスと、登録したいWordをいくつか一緒に書く。
そしたら、その登録Wordで検索した時のみそのサイトが表示される・・・
2.サイトのアドレスのみ書く。
そしたら、そのサイトを見た管理者が、そのサイトに適当なワードをいくつか並べて、
そのWordで検索した時のみそのサイトが表示
3.同じくサイトのアドレスのみ書く。
すると、ロボットがそのサイト内を検索し、重要そうな単語を拾う。
その単語でのみ検索可。
1と2はそんなに変わるもんでもないけど、3はメンドクサイな。
当然そこで値段も変わってくるわけだが。
ぶっちゃけ、依頼する場所によって値段は大幅に変わるだろうけど、
まともなとこに依頼するとして、1とか2ならデザイン抜きで150万。
3ならその倍くらいかと。
保守は当然別料金。 >>45
簡単に言うとYomi-searchを軽くして
データが増えても検索したら1秒ぐらいで表示されるものですかね。
ランキングとかはいらなくて。
で、拡張子が.htmlというのはとりあえずGoogleなどの
検索エンジンで各検索結果のページがロボットに拾われるようにしたいんです。
だから表示画面は.htmlがいいわけで。
.htaccessを使うと出来ると言うのは知らなかったです。
で、上記のようなものがフリーであればその制作者に
かけよって権利を譲っていただく交渉しようと考えていたし
無ければ独自で制作依頼をしたいなっと思っていました。
コスト的に結構、かかるんですね。参考にします。ありがとうございました。 >>46
おいおい、検索の結果なんて他のロボットは拾わないだろ。
検索のボットが自動で検索する訳じゃあるまいし。
例えば「2ch cgi」で検索した結果をリンクとして貼ってあったとして
それを拾ってもらいたいなら*.phpにすればいい。
Googleなら拡張子phpは拾ってくれるから。
後ろに引数が付いてる場合はどうかは知らんが。
↓こんなんでいいか?
ttp://cgi.cyborg.ne.jp/~hironori/cgi-bin/