X



検索エンジンつくりたい
0001ユリ垢版03/09/14 17:43ID:dPKSZIp3
17才の高校生です。
無料スペースつかってCGIを使った検索エンジンつくりたいのですが
ガキなんでまったくなにもわからないので教えてほしいのですが。
詳しいひといませんか?
0002nobodyさん垢版03/09/14 17:52ID:???
初めまして、エロイ人です。
仕事で検索エンジンの作成やチューニングもやっています。
何を聞きたいのですか?
0004nobodyさん垢版03/09/14 18:06ID:???
なんで>>1みたいな糞がちょくちょく現れるのかなぁ
0005nobodyさん垢版03/09/14 18:10ID:???
>>1
なにもわからないやつには無理。
基本的なことを学んでから出直して来い。
0006nobodyさん垢版03/09/14 18:11ID:???
>>4さんが毎日排泄するように
日夜を問わず製造されているのでは無いでしょうか?
0007nobodyさん垢版03/09/14 18:13ID:???
>>5
そういう排他的な考えではいけませんね。
何事も最初は知識0から始めるものです。
まず検索エンジンとはどういう仕組で成り立っているのか考えてみては如何でしょうか?
仕組みを分割していくと幾つかに分類できていくことができると思います。
0010nobodyさん垢版03/09/14 18:31ID:???
>>7
失礼しました。
リンクをはるのを失念していました。
0011ユリ垢版03/09/14 18:42ID:???
>>2
えっと、具体的にはYomi-Searchみたいなのをやりたいんですけど、
まったくわからないんです。
どうしたらいいんですか?
0012nobodyさん垢版03/09/14 18:53ID:???
Yomi-Searchのソースは配布されてますよね。
それをダウンロードして中を見ても、全く分からないということですか?
分からない原因は何でしょうか?
perlで書かれているがperl自体を知らないというのであれば、
perlを勉強するのが一番でしょう。
perlは知らないが他の言語なら分かるというのであれば、
perlのリファレンスを見つつ他の言語に書き直してみるのもいいかも知れません。
言語なんてどうでもいいんだ、オレはディレクトリ型サーチが何を目指しているのか知りたいんだ、
という場合は哲学への道を進んでみるのも手だと思います。
>>1に作りたいとあったので、まずperlなりphpなり必要な手段(言語)を身に付けるところから始めてみては如何でしょうか?
0015nobodyさん垢版03/09/14 20:49ID:???
誰も書いてないから書くけど、共有サーバを使うのはやめようね。

0016ユリ垢版03/09/14 21:57ID:???
ホームディレクトリ(ここでは public_htmlディレクトリとします)の下に、「naviディレクトリ」を作成し、さらにその下にロックファイル用ディレクトリの「lockディレクトリ」を作成します。
全体のディレクトリ構成とファイル位置の設置例は以下のとおりです。(かっこ内はパーミッションの設定値)
【構成例】

public_html / index.html (トップページ)
|
+-- navi / navi.cgi [755]
| navi.log [666]
| jcode.pl [644]
| bkup.dat [666]
| A.bak [666]
| B.bak [666]
| C.bak [666]
| new.gif
| recom.gif
|
+-- lock [777] /

↑これがよくわかりません。だれか教えてください。
0018nobodyさん垢版03/09/14 22:16ID:???
なるほど。yomi-searchは内部が複雑なので
簡単そうなCOSMO NAVIで来ましたか。いい選択です。

さて本題ですが、「これ」というのはパーミッションのことでしょうか?
単純にアップロードすれば表示されるHTMLと違い、
CGIの場合はプログラムを実行した結果を表示します。
そのための準備の一つにパーミッションの設定があります。
面倒なので略。
0019ユリ垢版03/09/14 22:21ID:???
◎CGIのご利用方法

CGIを利用される場合には、cgi-binというディレクトリを作成し、その中に
CGIを設置してください。拡張子は必ず.cgiとし、属性を700にしてくだ
さい。PerlのPATHは /usr/bin/perl となります。
HTMLファイルからCGIを参照する場合は次のように指定してください。
 /blcs/cgi-bin/CGIファイル名

↑なんかマニュアル通り設定だとダメみたいなんですけど、どうすればいいのでしょうか。。。
0020nobodyさん垢版03/09/14 22:34ID:???
なんでみんなこんな優しいの? 過疎だから?
0022nobodyさん垢版03/09/14 22:51ID:???
>>20
こども相手にあんまキツイことをいってもアレだろw
0023nobodyさん垢版03/09/14 22:59ID:???
>>1が高校3年生「たけし」でも、そのやさしさでレス出来たかな?
0024nobodyさん垢版03/09/14 23:04ID:???
つーか、スレ違いだろうが単質だろうが相手にする教えたがり厨がいるよな
0026nobodyさん垢版03/09/14 23:13ID:???

          / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
         /基礎的な知識がやや不足気味のような気がします。
  ∧_∧   / 参考になるような本を一冊読み終わってから始めてみては如何でしょうか?
 ( ・∀・)<   Web上の情報としては、yahooの
 ( 建前 )  \ トップ > コンピュータとインターネット > インターネット > WWW > CGI
 | | |    \カテゴリが参考になると思います。
__(__)_)______________
 ( _)_)
 | | |
 ( 本音 )  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
 ( 。A。)< 即実装の話に入れるたけし君カモーン
  ∨ ̄∨   \_______________
0027nobodyさん垢版03/09/15 13:22ID:???
Yomiよりいい感じの検索エンジン作ろう
0028nobodyさん垢版03/09/15 14:11ID:???
いい感じの意味が曖昧ですね。
がんがってください。
0029nobodyさん垢版03/09/18 20:52ID:BrtN4d/+
マジな話、検索ページをHTMLで生成される
検索エンジンが欲しいのだが、そういうのって可能?
製作するならぶっちゃけいくら必要になる?
0030nobodyさん垢版03/09/18 21:23ID:???
打ち捨てられたこのスレへようこそ。
幾つか確認させてください。

検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?
0031nobodyさん垢版03/09/18 21:51ID:???
>>30
検索されるたびにキャッシュしていくとか


あんまり意味ない気がするんだが
0032nobodyさん垢版03/09/18 22:24ID:nGSwS+tg
>検索ページをHTMLで生成 というのは、検索結果一覧をHTMLファイルにするということですか?
>つまり、想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくと?

Googleは、これをやっているのでは? でなきゃ、なんで
あんなに速いんだ?
0033nobodyさん垢版03/09/18 22:30ID:???
HTMLページの表示にどれだけ時間がかかるっていうんだよ
検索結果の一部はキャッシュしてるだろうが、ページの生成は
動的だろ
0034nobodyさん垢版03/09/18 22:56ID:???
>>32
Googleのでータベースはメモリ上に常駐してるって聞いたが
0035nobodyさん垢版03/09/18 23:59ID:BrtN4d/+
>>30
まぁ、そういう事ですかね。
普通のフリーの検索エンジンCGIなら
登録画面や検索結果表示画面は.cgiになります。
が、表示の速さやエラーの問題もあって.htmlである必要があるのです。

というわけでマジ見積もりお願いします。
0036nobodyさん垢版03/09/19 00:12ID:???
想定されるあらゆるキーワードに対して検索結果をあらかじめ静的なファイルとして生成しておくのは無理


-----end
0037nobodyさん垢版03/09/19 00:37ID:???
>>35
>登録画面や検索結果表示画面は.cgiになります。
HTMLにすりゃいいじゃん
0038nobodyさん垢版03/09/19 01:08ID:di5whLiA
>>37
それをできるかどうか聞いているのですが。
それともJavascriptかなにかで代用することを
言いたいのですか?
0039nobodyさん垢版03/09/19 01:53ID:???
>>38
例えば2chの板にindex.「html」が表示されるでしょ?
カキコするとbbs.cgiにPOSTするでしょ?
そしたらそのカキコがまたindex.「html」に表示されるでしょ?
0040nobodyさん垢版03/09/19 02:19ID:di5whLiA
>>39
まぁ、形はどうあれ登録サイトがhtmlで表示されていればいいんです。
あなたがそういう形式の検索エンジンを作成できるなら
だいたいいくらで請け負うか教えていただけませんか?
参考にしますので。
0041nobodyさん垢版03/09/19 07:34ID:???
>40
登録サイトの想定件数はいかほどですか?
0042nobodyさん垢版03/09/20 11:51ID:pAE1Wngt
>>41
返事遅れてすみません。。
1万が目標です。現在600です。
0043nobodyさん垢版03/09/20 19:25ID:???
> 1万が目標です。現在600です。

0045nobodyさん垢版03/09/21 03:52ID:???
>>42
カテゴリ分けしてるYahooみたいなのとは違うの?
つーか、確認しときたいけど拡張子がhtmlのcgiを作ってくれって事じゃないよね?
それなら.htaccessいじくりゃすむ話・・・・

登録の単語は手動で行なうのかな?
例えば、俺があるサイトの管理人で、その登録をしようとする。
その時に、
1.サイトのアドレスと、登録したいWordをいくつか一緒に書く。
そしたら、その登録Wordで検索した時のみそのサイトが表示される・・・

2.サイトのアドレスのみ書く。
そしたら、そのサイトを見た管理者が、そのサイトに適当なワードをいくつか並べて、
そのWordで検索した時のみそのサイトが表示

3.同じくサイトのアドレスのみ書く。
すると、ロボットがそのサイト内を検索し、重要そうな単語を拾う。
その単語でのみ検索可。

1と2はそんなに変わるもんでもないけど、3はメンドクサイな。
当然そこで値段も変わってくるわけだが。

ぶっちゃけ、依頼する場所によって値段は大幅に変わるだろうけど、
まともなとこに依頼するとして、1とか2ならデザイン抜きで150万。
3ならその倍くらいかと。
保守は当然別料金。
004642垢版03/09/21 09:10ID:31jhVBaJ
>>45
簡単に言うとYomi-searchを軽くして
データが増えても検索したら1秒ぐらいで表示されるものですかね。
ランキングとかはいらなくて。

で、拡張子が.htmlというのはとりあえずGoogleなどの
検索エンジンで各検索結果のページがロボットに拾われるようにしたいんです。
だから表示画面は.htmlがいいわけで。
.htaccessを使うと出来ると言うのは知らなかったです。

で、上記のようなものがフリーであればその制作者に
かけよって権利を譲っていただく交渉しようと考えていたし
無ければ独自で制作依頼をしたいなっと思っていました。

コスト的に結構、かかるんですね。参考にします。ありがとうございました。
0047nobodyさん垢版03/09/21 09:59ID:kPJ/tg2Z
>>46
おいおい、検索の結果なんて他のロボットは拾わないだろ。
検索のボットが自動で検索する訳じゃあるまいし。

例えば「2ch cgi」で検索した結果をリンクとして貼ってあったとして
それを拾ってもらいたいなら*.phpにすればいい。
Googleなら拡張子phpは拾ってくれるから。
後ろに引数が付いてる場合はどうかは知らんが。
0049nobodyさん垢版03/09/22 00:35ID:???
↓こんなんでいいか?
ttp://cgi.cyborg.ne.jp/~hironori/cgi-bin/
0050nobody垢版03/09/22 21:57ID:???
2003年9月20日 全文検索ソフト G-Search Personal - ベクターソフトニュース - http://www.vector.co.jp/magazine/softnews/030917/n0309174.html

全文検索ソフト G-Search Personal
ハードディスク内のWord/Excel/PowerPoint/TXT/HTML/PDFファイルを全文検索するソフト
--------------------------------------------------------------------------------
● 全文検索ソフト G-Search Personal Ver.1.12
作 者 : ゆうき さん
対応OS : Windows XP/2000/98/95/NT
種 別 : フリーソフト
作者のホームページ : http://www36.tok2.com/home/yuuki05/

■Windows XP/2000/98/95/NT  ■フリーソフト 検索キーワードが含まれているファイルがリストアップされる

ハードディスクなどに保存されている、Word/Excel/PowerPointファイル、テキストファイル、HTMLファイル、Acrobat PDFファイルを対象に全文検索を行えるソフト。
検索対象はドライブ/フォルダ単位で指定する。ローカルディスクのほか、ネットワークドライブやCD-ROMドライブなども検索対象に含めることができる。
指定したフォルダより下の階層のフォルダは自動的に検索対象となる。
検索するファイル形式はユーザが選択することが可能。
初期設定ではDOC/XLS/PDFファイルが検索対象となっているが、PPT/TXT/HTML(HTM)を追加することも可能で、指定形式のファイルのみを対象に検索できる。
005242垢版03/09/22 23:46ID:GFhRbp8t
すみません、、激しく勘違いしていました。。
基本的にYomi-searchで望むことは大体出来ました。

あとは、Yomi-Searchより高速で処理の速い+αの
検索エンジンを作れないものですかね?
単純にYomi-SearchのPHP版を使用したらいいというわけではないし。
0053nobodyさん垢版03/09/22 23:53ID:???
今の君には無理だから勉強しなさいな
005442垢版03/09/22 23:57ID:GFhRbp8t
>>53
いや、自分で作るのではないです。外注するのです。
その場合のコスト見積もりを29から聞いているわけで...
0055nobodyさん垢版03/09/23 00:05ID:???
外注ならそういう仕様で見積もり依頼すりゃいいじゃないの。
0056nobodyさん垢版03/09/23 03:13ID:2l0WTZfM
引越しじゃないけど、>>55の言う通り複数の業者に見積もり依頼すればいいよ。
見積もりもできないようなとこには発注しない。
不況で買い手市場(多分)なはずだから、値切ったりもできるかもよw
0057nobodyさん垢版03/09/23 08:33ID:cAN9O/VY
コンペ開始↓

とりあえず50万でどうさ?
0060nobodyさん垢版04/10/09 14:59:47ID:???
こんなスレが一年もあるとは・・・しかも3つ上の日付が一年以上前だ
0062nobodyさん垢版04/12/20 05:40:32ID:cWC8ojNe
まだあった、ここ・・・
とりあえず、巷で使われてる検索エンジンでも分類してみてはどう?
中小でも独自エンジンで使い勝手の良さそうなエンジンがある。
そこのコンタクト取るのが一番早い。
得てして非公開だがね
0065nobodyさん垢版04/12/20 08:00:52ID:SmxJcj5b
形態素解析・n-c・フルサーチ
まじめに作ってみたいなぁ・・・
0066jibook垢版05/01/14 18:28:26ID:TjNuM0Sd
皆さんはどこで運営、作成していますか?
0067jibook垢版05/01/14 18:29:24ID:TjNuM0Sd
皆さんはどこで運営、作成していますか?
0069nobodyさん垢版2005/07/27(水) 05:07:42ID:VXg0NE9b
ロボット型検索エンジン作ればいんじゃん
0070nobodyさん垢版2005/07/27(水) 11:06:06ID:???
>>1

そんなん作ったらあっと言う間にアカウント消されるよ

一応作り方は

sql+php

----------------------はい終わり--------------------------
0072モンゴルイタリア人12世垢版2006/03/20(月) 17:21:41ID:PIteGTUG
グーグルのを借りれば?
ライブドア見たいに
0073nobodyさん垢版2006/03/25(土) 03:04:13ID:zWnWakqL
費用はどのくらいかかるんですかね?
0074nobodyさん垢版2006/03/26(日) 17:42:26ID:R1D5eEFB
無料だよ
0075nobodyさん垢版2006/03/27(月) 17:07:36ID:???
単に使いたいだけなのか、作る事に興味があるのか分からんな。
0076nobodyさん垢版2006/03/30(木) 17:26:30ID:???
人口無能検索エンジンを作ります。
全然キーワードとマッチしないサイトを拾い上げるロボット型検索エンジン
0077モンゴルイタリア人12世垢版2006/12/28(木) 20:58:08ID:PxIYLsOg
かつてない検索エンジンをつくらないと、人気がでないよ
0078nobodyさん垢版2006/12/28(木) 22:19:28ID:???
画像検索創ってよ、あったようなきもするけど
0080nobodyさん垢版2006/12/29(金) 12:51:51ID:oDxgb420
画像で検索ってどこに載ってる?ググル
0081ぴっと垢版2007/01/31(水) 20:58:47ID:Fl42X7jm
私は13歳の中1です。
Naku’s Japanの設立者です。

検索エンジンの作り方おしえてください。
できればロボット型のほうを・・・・・
0082nobodyさん垢版2007/02/01(木) 01:44:04ID:???
昔、中学生が作ったロボット型サーチエンジンがあったぞ
(いまもあるのかもしれんが)
namazu使ってたんだったけか
ロボットの走らせ方は検索すれば出てくるだろ
まあがんばれやw
0084nobodyさん垢版2007/02/01(木) 23:04:12ID:???
ちゅうがくせいでもできる ぶろぐ あふぃりえいと
0085面倒だけど仕事だよ垢版2007/09/28(金) 05:22:51ID:???
誰か教えてください ある会社に勤めていますが
そこでPC4台を使って仕事の資料ホームページを作成しました
その中に検索システムを作成したいのですが
外部ネットワークに繋ぐのは不可能なんです
(会社の情報もあるのでPC4台内だけで動かしたい)
PC4台はハブでつながっています 可能なのか不可能なのか
わかる方教えてください もし出来るならどのような言語から覚えたら良いですか?
HTMLくらいしかわかりません お願いします
0086nobodyさん垢版2008/09/04(木) 01:54:41ID:???
>>85
可能
習得が早いphpでもやっときゃおk
0088nobodyさん垢版2008/09/26(金) 23:46:01ID:YewbVftQ
なんだ?ここ
0089nobodyさん垢版2008/09/26(金) 23:59:21ID:???
あのね ここはね 2ちゃんねるっていってね

そこそこの規模の掲示板なんだよ
0092nobodyさん垢版2013/10/29(火) 21:49:23.26ID:z4zTbkHZ
>>1
5年ぶりにageてみるけど、意味ないな。
0093nobodyさん垢版2013/11/10(日) 00:23:27.89ID:OF1ojZRd
386 :名無しさん@お腹いっぱい。:2013/11/05(火) 22:43:17.55 ID:ienXsxbb
>>378
「ライヤーゲーム」って知らないの?


387 :名無しさん@お腹いっぱい。:2013/11/05(火) 23:51:04.45 ID:P27Y9boe
>>378
鬼の首とったかのように勝利宣言してるところ悪いけど、liarはライアーでもライヤーでも間違いではないよ
victoryをビクトリー「なんて読んでたら、即座に指摘される」かな?


388 :名無しさん@お腹いっぱい。:2013/11/06(水) 00:39:03.37 ID:atxSCjuQ
>>386
知らない。検索してみたがそんなのなかった。


389 :名無しさん@お腹いっぱい。:2013/11/06(水) 00:52:57.18 ID:9438j31N
>>388
どんなしょぼい検索エンジン使ってんだよw


http://anago.2ch.net/test/read.cgi/slotk/1382525961/99-999
0095nobodyさん垢版2013/11/29(金) 09:38:17.47ID:???
例えばFC2において、「ドラマ」で検索した場合、
誰も見ないような朝鮮、中華ドラマも一緒に表示されるんですが、
排除条件のようなものを作り、こういったものを表示させないようにして欲しい
かなりの人が欲しい機能
0096nobodyさん垢版2013/12/03(火) 20:16:20.30ID:JDkHKCU3
403 :名無しさん@入浴中:2013/11/25(月) 00:14:17.89 ID:izyUbVX10
139 :「名無しわざとか?」とかイヤミを言われた:2013/11/24(日) 23:14:17.20 ID:zfd4SHfE
>>136
今夜のずりネタとして目に焼き付けに行くのが目的でしたが、貴方のおかげで大勝でき、フラミンゴ→クリスタル京都とはしごさせて頂きました
ごちっす!


140 :「名無しわざとか?」とかイヤミを言われた:2013/11/25(月) 00:13:20.91 ID:K9fTpS1+
>>129
川崎,蒲田


http://kohada.2ch.net/test/read.cgi/slotj/1382413382/l50


404 :名無しさん@入浴中:2013/11/25(月) 00:32:13.79 ID:i/iZ7DyX0
遊び方なんて人それぞれだから関係ないだろw
オレはオナニーがわりに新人ばっかり週3くらい入ってるが新人多すぎて入りきれない
本当は週3は多すぎて逝けない事もしばしばなんだけど
新人見るとどうしても行っちゃうし外してもよっぽどでなければ何とも思わない

http://kilauea.bbspink.com/test/read.cgi/soap/1384255463/403-404
0099nobodyさん垢版2017/12/30(土) 13:16:34.44ID:YhlYw6jg
誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。

グーグル検索⇒『半藤のブブイウイウレレ』

IR8C9YDWVB
0100nobodyさん垢版2018/11/07(水) 17:32:01.92ID:???
仕事で3000サイト限定の検索エンジン(というかクローラー)作ったけどかなりめんどかった。
本文以外の文字をいかに除外するかが難問。
これはGoogleですら不完全。
完全汎用化はできずにある程度サイトごとにカスタマイズするハメになった。
しかし、今ならAIで精度上げられるのではないだろうか。
0101nobodyさん垢版2023/10/14(土) 15:31:43.44ID:???
幸せなら俺が幾らでも分けてあげる!
レスを投稿する


ニューススポーツなんでも実況