検索エンジンつくりたい
17才の高校生です。
無料スペースつかってCGIを使った検索エンジンつくりたいのですが
ガキなんでまったくなにもわからないので教えてほしいのですが。
詳しいひといませんか?
初めまして、エロイ人です。
仕事で検索エンジンの作成やチューニングもやっています。
何を聞きたいのですか? なんで>>1みたいな糞がちょくちょく現れるのかなぁ >>1
なにもわからないやつには無理。
基本的なことを学んでから出直して来い。 >>4さんが毎日排泄するように
日夜を問わず製造されているのでは無いでしょうか? >>5
そういう排他的な考えではいけませんね。
何事も最初は知識0から始めるものです。
まず検索エンジンとはどういう仕組で成り立っているのか考えてみては如何でしょうか?
仕組みを分割していくと幾つかに分類できていくことができると思います。 >>7
失礼しました。
リンクをはるのを失念していました。 >>2
えっと、具体的にはYomi-Searchみたいなのをやりたいんですけど、
まったくわからないんです。
どうしたらいいんですか? Yomi-Searchのソースは配布されてますよね。
それをダウンロードして中を見ても、全く分からないということですか?
分からない原因は何でしょうか?
perlで書かれているがperl自体を知らないというのであれば、
perlを勉強するのが一番でしょう。
perlは知らないが他の言語なら分かるというのであれば、
perlのリファレンスを見つつ他の言語に書き直してみるのもいいかも知れません。
言語なんてどうでもいいんだ、オレはディレクトリ型サーチが何を目指しているのか知りたいんだ、
という場合は哲学への道を進んでみるのも手だと思います。
>>1に作りたいとあったので、まずperlなりphpなり必要な手段(言語)を身に付けるところから始めてみては如何でしょうか? 誰も書いてないから書くけど、共有サーバを使うのはやめようね。
ホームディレクトリ(ここでは public_htmlディレクトリとします)の下に、「naviディレクトリ」を作成し、さらにその下にロックファイル用ディレクトリの「lockディレクトリ」を作成します。
全体のディレクトリ構成とファイル位置の設置例は以下のとおりです。(かっこ内はパーミッションの設定値)
【構成例】
public_html / index.html (トップページ)
|
+-- navi / navi.cgi [755]
| navi.log [666]
| jcode.pl [644]
| bkup.dat [666]
| A.bak [666]
| B.bak [666]
| C.bak [666]
| new.gif
| recom.gif
|
+-- lock [777] /
↑これがよくわかりません。だれか教えてください。 なるほど。yomi-searchは内部が複雑なので
簡単そうなCOSMO NAVIで来ましたか。いい選択です。
さて本題ですが、「これ」というのはパーミッションのことでしょうか?
単純にアップロードすれば表示されるHTMLと違い、
CGIの場合はプログラムを実行した結果を表示します。
そのための準備の一つにパーミッションの設定があります。
面倒なので略。 ◎CGIのご利用方法
CGIを利用される場合には、cgi-binというディレクトリを作成し、その中に
CGIを設置してください。拡張子は必ず.cgiとし、属性を700にしてくだ
さい。PerlのPATHは /usr/bin/perl となります。
HTMLファイルからCGIを参照する場合は次のように指定してください。
/blcs/cgi-bin/CGIファイル名
↑なんかマニュアル通り設定だとダメみたいなんですけど、どうすればいいのでしょうか。。。 >>20
こども相手にあんまキツイことをいってもアレだろw >>1が高校3年生「たけし」でも、そのやさしさでレス出来たかな? つーか、スレ違いだろうが単質だろうが相手にする教えたがり厨がいるよな >>23
なんで、男にやさしくしなきゃならんのだ?
/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
/基礎的な知識がやや不足気味のような気がします。
∧_∧ / 参考になるような本を一冊読み終わってから始めてみては如何でしょうか?
( ・∀・)< Web上の情報としては、yahooの
( 建前 ) \ トップ > コンピュータとインターネット > インターネット > WWW > CGI
| | | \カテゴリが参考になると思います。
__(__)_)______________
( _)_)
| | |
( 本音 ) / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
( 。A。)< 即実装の話に入れるたけし君カモーン
∨ ̄∨ \_______________ いい感じの意味が曖昧ですね。
がんがってください。 マジな話、検索ページをHTMLで生成される
検索エンジンが欲しいのだが、そういうのって可能?
製作するならぶっちゃけいくら必要になる? 打ち捨てられたこのスレへようこそ。
幾つか確認させてください。
検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
>>30
検索されるたびにキャッシュしていくとか
あんまり意味ない気がするんだが >検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
>つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
Googleは、これをやっているのでは? でなきゃ、なんで
あんなに速いんだ? HTMLページの表示にどれだけ時間がかかるっていうんだよ
検索結果の一部はキャッシュしてるだろうが、ページの生成は
動的だろ >>32
Googleのでータベースはメモリ上に常駐してるって聞いたが >>30
まぁ、そういう事ですかね。
普通のフリーの検索エンジンCGIなら
登録画面や検索結果表示画面は.cgiになります。
が、表示の速さやエラーの問題もあって.htmlである必要があるのです。
というわけでマジ見積もりお願いします。 想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくのは無理
-----end >>35
>登録画面や検索結果表示画面は.cgiになります。
HTMLにすりゃいいじゃん >>37
それをできるかどうか聞いているのですが。
それともJavascriptかなにかで代用することを
言いたいのですか? >>38
例えば2chの板にindex.「html」が表示されるでしょ?
カキコするとbbs.cgiにPOSTするでしょ?
そしたらそのカキコがまたindex.「html」に表示されるでしょ? >>39
まぁ、形はどうあれ登録サイトがhtmlで表示されていればいいんです。
あなたがそういう形式の検索エンジンを作成できるなら
だいたいいくらで請け負うか教えていただけませんか?
参考にしますので。 >>41
返事遅れてすみません。。
1万が目標です。現在600です。 >>42
カテゴリ分けしてるYahooみたいなのとは違うの?
つーか、確認しときたいけど拡張子がhtmlのcgiを作ってくれって事じゃないよね?
それなら.htaccessいじくりゃすむ話・・・・
登録の単語は手動で行なうのかな?
例えば、俺があるサイトの管理人で、その登録をしようとする。
その時に、
1.サイトのアドレスと、登録したいWordをいくつか一緒に書く。
そしたら、その登録Wordで検索した時のみそのサイトが表示される・・・
2.サイトのアドレスのみ書く。
そしたら、そのサイトを見た管理者が、そのサイトに適当なワードをいくつか並べて、
そのWordで検索した時のみそのサイトが表示
3.同じくサイトのアドレスのみ書く。
すると、ロボットがそのサイト内を検索し、重要そうな単語を拾う。
その単語でのみ検索可。
1と2はそんなに変わるもんでもないけど、3はメンドクサイな。
当然そこで値段も変わってくるわけだが。
ぶっちゃけ、依頼する場所によって値段は大幅に変わるだろうけど、
まともなとこに依頼するとして、1とか2ならデザイン抜きで150万。
3ならその倍くらいかと。
保守は当然別料金。 >>45
簡単に言うとYomi-searchを軽くして
データが増えても検索したら1秒ぐらいで表示されるものですかね。
ランキングとかはいらなくて。
で、拡張子が.htmlというのはとりあえずGoogleなどの
検索エンジンで各検索結果のページがロボットに拾われるようにしたいんです。
だから表示画面は.htmlがいいわけで。
.htaccessを使うと出来ると言うのは知らなかったです。
で、上記のようなものがフリーであればその制作者に
かけよって権利を譲っていただく交渉しようと考えていたし
無ければ独自で制作依頼をしたいなっと思っていました。
コスト的に結構、かかるんですね。参考にします。ありがとうございました。 >>46
おいおい、検索の結果なんて他のロボットは拾わないだろ。
検索のボットが自動で検索する訳じゃあるまいし。
例えば「2ch cgi」で検索した結果をリンクとして貼ってあったとして
それを拾ってもらいたいなら*.phpにすればいい。
Googleなら拡張子phpは拾ってくれるから。
後ろに引数が付いてる場合はどうかは知らんが。
↓こんなんでいいか?
ttp://cgi.cyborg.ne.jp/~hironori/cgi-bin/ 2003年9月20日 全文検索ソフト G-Search Personal - ベクターソフトニュース - http://www.vector.co.jp/magazine/softnews/030917/n0309174.html
全文検索ソフト G-Search Personal
ハードディスク内のWord/Excel/PowerPoint/TXT/HTML/PDFファイルを全文検索するソフト
--------------------------------------------------------------------------------
● 全文検索ソフト G-Search Personal Ver.1.12
作 者 : ゆうき さん
対応OS : Windows XP/2000/98/95/NT
種 別 : フリーソフト
作者のホームページ : http://www36.tok2.com/home/yuuki05/
■Windows XP/2000/98/95/NT ■フリーソフト 検索キーワードが含まれているファイルがリストアップされる
ハードディスクなどに保存されている、Word/Excel/PowerPointファイル、テキストファイル、HTMLファイル、Acrobat PDFファイルを対象に全文検索を行えるソフト。
検索対象はドライブ/フォルダ単位で指定する。ローカルディスクのほか、ネットワークドライブやCD-ROMドライブなども検索対象に含めることができる。
指定したフォルダより下の階層のフォルダは自動的に検索対象となる。
検索するファイル形式はユーザが選択することが可能。
初期設定ではDOC/XLS/PDFファイルが検索対象となっているが、PPT/TXT/HTML(HTM)を追加することも可能で、指定形式のファイルのみを対象に検索できる。 すみません、、激しく勘違いしていました。。
基本的にYomi-searchで望むことは大体出来ました。
あとは、Yomi-Searchより高速で処理の速い+αの
検索エンジンを作れないものですかね?
単純にYomi-SearchのPHP版を使用したらいいというわけではないし。 >>53
いや、自分で作るのではないです。外注するのです。
その場合のコスト見積もりを29から聞いているわけで... 外注ならそういう仕様で見積もり依頼すりゃいいじゃないの。 引越しじゃないけど、>>55の言う通り複数の業者に見積もり依頼すればいいよ。
見積もりもできないようなとこには発注しない。
不況で買い手市場(多分)なはずだから、値切ったりもできるかもよw こんなスレが一年もあるとは・・・しかも3つ上の日付が一年以上前だ まだあった、ここ・・・
とりあえず、巷で使われてる検索エンジンでも分類してみてはどう?
中小でも独自エンジンで使い勝手の良さそうなエンジンがある。
そこのコンタクト取るのが一番早い。
得てして非公開だがね 漏れも手伝ってやるよっ!
まずは高速手動型エンジンね
http://www.8823.net/ 形態素解析・n-c・フルサーチ
まじめに作ってみたいなぁ・・・ >>1
そんなん作ったらあっと言う間にアカウント消されるよ
一応作り方は
sql+php
----------------------はい終わり-------------------------- 単に使いたいだけなのか、作る事に興味があるのか分からんな。 人口無能検索エンジンを作ります。
全然キーワードとマッチしないサイトを拾い上げるロボット型検索エンジン かつてない検索エンジンをつくらないと、人気がでないよ 私は13歳の中1です。
Naku’s Japanの設立者です。
検索エンジンの作り方おしえてください。
できればロボット型のほうを・・・・・ 昔、中学生が作ったロボット型サーチエンジンがあったぞ
(いまもあるのかもしれんが)
namazu使ってたんだったけか
ロボットの走らせ方は検索すれば出てくるだろ
まあがんばれやw 誰か教えてください ある会社に勤めていますが
そこでPC4台を使って仕事の資料ホームページを作成しました
その中に検索システムを作成したいのですが
外部ネットワークに繋ぐのは不可能なんです
(会社の情報もあるのでPC4台内だけで動かしたい)
PC4台はハブでつながっています 可能なのか不可能なのか
わかる方教えてください もし出来るならどのような言語から覚えたら良いですか?
HTMLくらいしかわかりません お願いします
>>85
可能
習得が早いphpでもやっときゃおk >>85
こっから探せ
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html#free_jp あのね ここはね 2ちゃんねるっていってね
そこそこの規模の掲示板なんだよ 386 :名無しさん@お腹いっぱい。:2013/11/05(火) 22:43:17.55 ID:ienXsxbb
>>378
「ライヤーゲーム」って知らないの?
387 :名無しさん@お腹いっぱい。:2013/11/05(火) 23:51:04.45 ID:P27Y9boe
>>378
鬼の首とったかのように勝利宣言してるところ悪いけど、liarはライアーでもライヤーでも間違いではないよ
victoryをビクトリー「なんて読んでたら、即座に指摘される」かな?
388 :名無しさん@お腹いっぱい。:2013/11/06(水) 00:39:03.37 ID:atxSCjuQ
>>386
知らない。検索してみたがそんなのなかった。
389 :名無しさん@お腹いっぱい。:2013/11/06(水) 00:52:57.18 ID:9438j31N
>>388
どんなしょぼい検索エンジン使ってんだよw
http://anago.2ch.net/test/read.cgi/slotk/1382525961/99-999 例えばFC2において、「ドラマ」で検索した場合、
誰も見ないような朝鮮、中華ドラマも一緒に表示されるんですが、
排除条件のようなものを作り、こういったものを表示させないようにして欲しい
かなりの人が欲しい機能 403 :名無しさん@入浴中:2013/11/25(月) 00:14:17.89 ID:izyUbVX10
139 :「名無しわざとか?」とかイヤミを言われた:2013/11/24(日) 23:14:17.20 ID:zfd4SHfE
>>136
今夜のずりネタとして目に焼き付けに行くのが目的でしたが、貴方のおかげで大勝でき、フラミンゴ→クリスタル京都とはしごさせて頂きました
ごちっす!
140 :「名無しわざとか?」とかイヤミを言われた:2013/11/25(月) 00:13:20.91 ID:K9fTpS1+
>>129
川崎,蒲田
http://kohada.2ch.net/test/read.cgi/slotj/1382413382/l50
404 :名無しさん@入浴中:2013/11/25(月) 00:32:13.79 ID:i/iZ7DyX0
遊び方なんて人それぞれだから関係ないだろw
オレはオナニーがわりに新人ばっかり週3くらい入ってるが新人多すぎて入りきれない
本当は週3は多すぎて逝けない事もしばしばなんだけど
新人見るとどうしても行っちゃうし外してもよっぽどでなければ何とも思わない
http://kilauea.bbspink.com/test/read.cgi/soap/1384255463/403-404 誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。
グーグル検索⇒『半藤のブブイウイウレレ』
IR8C9YDWVB 仕事で3000サイト限定の検索エンジン(というかクローラー)作ったけどかなりめんどかった。
本文以外の文字をいかに除外するかが難問。
これはGoogleですら不完全。
完全汎用化はできずにある程度サイトごとにカスタマイズするハメになった。
しかし、今ならAIで精度上げられるのではないだろうか。