X



検索エンジンをつくりたい

0001yam ◆AyW.Rdbg
垢版 |
01/12/22 23:16ID:???
ヤフーのような検索エンジンを作って、
自力で商用化をしたいんだけれど、
開発費用っていくらぐらいかかる?
信頼のおける技術者も探しています。
0044名無しさん@お腹いっぱい。
垢版 |
01/12/29 18:59ID:???
ネタにマジレスだけど、、

>>1よ。
個人の要求に応じて日々ネットを飛び回って、
要求に合ったWebを発見したら通知してくれる
「エージェント」を作ってくれ。

※技術的に極めて難しいのは承知の上。
0045nobodyさん
垢版 |
02/04/19 03:03ID:???
    d_b    / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
              (  ゚曲゚)  < 日下部は俺一人でいい…!
             /⊂彡Vミつ   \_________
             |_ζ<O> ζ
              (_)_)
0046名無しさん
垢版 |
03/01/03 01:26ID:???
            / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\
Λ_Λ  | 君さぁ こんなスレッド立てるから          |
( ´∀`)< 厨房って言われちゃうんだよ             |
( ΛΛ つ >―――――――――――――――――――‐<
 ( ゚Д゚) < おまえのことを必要としてる奴なんて         |
 /つつ  | いないんだからさっさと回線切って首吊れ     |
       \____________________/

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)

(-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ… (-_-) ハヤクシンデネ…
(∩∩) (∩∩) (∩∩)
0047nobodyさん
垢版 |
03/01/03 23:29ID:qJ+hUpKo
>>12
この人が作った雑誌を見てみたい。
勘違い糞雑誌(社)のなんと多いこと。
中途半端に出てくるくらいなら一生紙にしがみ付いてろ。
0049nobodyさん
垢版 |
03/02/02 07:36ID:???
みえみえの自作自演する寒い1には何やっても無理。w

2 :名無しさん@お腹いっぱい。 :01/12/22 23:26 ID:???
>>1
スゲー面白そうじゃん、俺も参加しよ!!!!
みんなもやろーぜ!!!!!!!!


0053山崎渉
垢版 |
03/04/20 06:09ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
0054t-akiyama
垢版 |
03/05/20 17:55ID:???
携帯ゲーム機"プレイステーションポータブル(PSP)

 このPSPは、新規格UMD(ユニバーサルメディアディスク)というディスクを利用しており、そのサイズは直径6cmととても小さい(CDの半分程度)。 容量は1.8GBとなっている。
画面は4.5インチのTFT液晶で、480px x 272px(16:9)。MPEG4の再生やポリゴンも表示可能。外部端子として、USB2.0とメモリースティックコネクタが用意されているという。

この際、スク・エニもGBAからPSPに乗り換えたらどうでしょう。スク・エニの場合、PSPの方が実力を出しやすいような気がするんですが。
任天堂が携帯ゲーム機で圧倒的なシェアをもってるなら、スク・エニがそれを崩してみるのもおもしろいですし。かつて、PS人気の引き金となったFF7のように。
0055山崎渉
垢版 |
03/05/22 02:11ID:???
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
0056山崎渉
垢版 |
03/05/28 17:15ID:???
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
0057nobodyさん
垢版 |
03/06/24 04:27ID:GbEoFmir
ここで人気No.1のAV女優、及川奈央のオマ○コが見れました!!
うぉぉぉぉぉぉ!!!!素晴らしい!!!(*´Д`*)ハァハァ
http://plaza16.mbn.or.jp/~satchel/oikawa_nao/
0058山崎 渉
垢版 |
03/07/15 11:11ID:???

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
0059山崎 渉
垢版 |
03/08/02 02:40ID:???
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
0060ぼるじょあ ◆ySd1dMH5Gk
垢版 |
03/08/02 05:24ID:???
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
0061山崎 渉
垢版 |
03/08/15 22:53ID:???
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
0063nobodyさん
垢版 |
04/02/19 20:32ID:???
まことに勝手ながら、本日を持ちましてこのスレは
検索エンジン製作に関するスレになりました。
0064nobodyさん
垢版 |
04/02/20 04:34ID:???
マジで検索エンジン制作の話題したいんだが

PHP+MySQLでヤフー式の簡単な検索エンジンを制作する場合
どのくらいのアクセス数、登録数に耐えられると思う?
0065nobodyさん
垢版 |
04/02/20 07:48ID:+ZtOPAr+
リンク集をhtmlで作って、googleのサイト内検索窓でも付けれ(藁
0066中の人
垢版 |
04/02/20 09:10ID:2ykvpncx
>>64
どんなマシンを何台使うかによるよ。
あと、検索精度にどの程度こだわるかにも。
フレイズ検索は不要と割り切ればMySQLでもそれなりにスケールするだろう。
0067nobodyさん
垢版 |
04/02/20 12:31ID:???
>>64
俺同じようなのPerl+Accessで作ったけど
Accessでも10万件くらいはいけるんじゃないの?
とか楽観的に考えてる。
0068nobodyさん
垢版 |
04/02/20 15:18ID:pO9W6gy/
>>66
例えばマシンはレン鯖によくある下記のスペックだとする

OS:RedhatLinux
CPU:Pen4 2.4GHz
RAM:1GB
HDD:120GB×2(RAID)
回線:光100Mbps

俺としてはYomi-searchほどあれこれ機能がついてなくてもいい。
用は検索の鮮度を上げることと、下位に位置するページも
見やすいような作りを望むわけだ。下位ページが悪いわけじゃないし。

>>67
個人、(もしくは中小)規模の人間が数人でせっせとやったところで
現状、大手の検索エンジンがある以上、数年でせいぜい10万件が限度だと思う。
と考えると、問題は数より中身で勝負なわけで。
検索スピードは最低でもYAHOOやGoogleと同レベルにする必要はある。
そして+αの機能。ランキングやアクセス数以外の面で何かユーザーにとって
”使いやすい”機能を提供しなければならない。
0069nobodyさん
垢版 |
04/02/21 19:46ID:???
せっかく議題出してるのに返事ねーよ・・・鬱
0070中の人
垢版 |
04/02/22 12:19ID:n4Z2WSBu
それぐらいのマシンだったら、10万件のっけたとして、
1日10万アクセスぐらいは楽にこなすと思う。
MySQLで作っても大丈夫でしょう。
+αの部分がどれだけの計算量を必要とするかにもよるが。。
0071nobodyさん
垢版 |
04/02/22 12:48ID:???
>>68
個人でサイトの登録なんかしないよ。無断リンクで怒られるし。
サイト管理者に登録してもらうんだよ。
0072nobodyさん
垢版 |
04/02/22 16:40ID:???
>>70
なるほど。あとは+αの部分だな。。RSSを絡めるのもいいとは思うし
アマゾンみたいに自分にあったサイトを抽出するような機能を
出せるのもいいとは思うが、それだとかなり大変そうだしな・・。

>>71
書き方が悪かった。個人や小規模の場合、YAHOOやGoogleなどの
組織と比べて動ける範囲や予算も知れてるだろうって事。
リンク獲得も人や金がいるだろうしね。
0073nobodyさん
垢版 |
04/02/22 23:54ID:???
検索エンジンで食っていけるかな?
0074nobodyさん
垢版 |
04/02/23 00:58ID:???
>>73
単なる検索エンジンなら無理だと思う。
上でもあるように+αの効果が無いと。
0075nobodyさん
垢版 |
04/02/23 15:51ID:???
>>74
大した機能なくても(Yomi-Search使ってたり)ジャンルを特化したり
すれば結構人が来てるサイトもあるよ。
0076nobodyさん
垢版 |
04/02/23 19:15ID:XTMpAAWU
>>75
俺としては基本的にYomi-Searchほどの機能は無くてもいいと思う。
特にランキング関係はサイトの差別化になり、良くないし。
だからYAHOO!のように地味でもキーワードにあったサイトを出すのが一番だろうね。
あとはジャンル化。Googleで検索しても目的のキーワードで拾えない
事が多々あるから専門分野に特化した検索エンジンなら効果あるかもね。

例えば野球の検索エンジンで試合結果をすばやく更新した
サイトを検索結果で上位に持ってくるとかね。
サイトのupdateの時間と野球の大体の試合時間を予測(もしくは手動で観察)
する必要があるけど、野球を見逃した人なんかは試合結果を気になって検索するしね。
0077nobodyさん
垢版 |
04/02/23 22:35ID:???
>>76
それだけ見るといわゆる「アンテナ」でいいじゃんって感じがする。
野球系の役に立つサイトを100個ぐらいあつめてアンテナに登録して
おけば>>76に書いてあることは実現できるよね。

俺は「検索はアバウトだから良い」と思っているのでそういう特化した
検索エンジンはいらない。むしろ多少外れた内容がたまにあるから知識
が深くなることも多いと思う。
ところがたまに外れ過ぎるときがあるのと、ピンポイントでの検索を
行いたい時に困る。

あ、これ書いていたら良い方法が思い付いたかも…。



0078nobodyさん
垢版 |
04/02/23 23:48ID:???
>>77
カテゴリ分類されたロボット検索エンジン?
007977
垢版 |
04/02/24 00:24ID:???
>>78
いや、『方法が思い付いた』と言っても何かアルゴリズムが思い付いたとか
ではなくて『もし、こんなことが可能なら理想に近くなるかも!?』と思った
程度の話。

しかも、紙に書きながら考えをまとめようとしているが、まったくまとまらん。

とりあえず、検索エンジンだけで成り立つシステムではないなぁ。
ってか自分でもよくわからん。

0080nobodyさん
垢版 |
04/02/24 00:51ID:???
>>77
なるほど。例えば商売にするわけじゃなくてもはやりそれなりの反響は欲しいわけで
機能を限定したユーザーだけが利用するような検索エンジンを作っては
範囲がかなり狭まるからね。

俺もなんとなく”イメージ”は沸くんだが、なかなか口に出していえない。
ようはサイトに登録する人・観覧する人双方それぞれが得をして
その仕組みによってインターネットを活用する人が更に増えればいいんだけどね。
今は誰でもどんなページでも検索エンジンに登録できて
「野球」というキーワードで検索しても野球のサイトが出なかったりするし
それぞれ目的が違うしね。(試合結果を見たいのか、大リーグの応援サイトを見たいのか等)

と↑を書いてたら俺も微妙に浮かんではきてるんだけどねw
008177
垢版 |
04/02/24 01:33ID:???
>今は誰でもどんなページでも検索エンジンに登録できて
>「野球」というキーワードで検索しても野球のサイトが出なかったりするし
俺は違うと思う。
あくまで検索エンジンはできる限り多くのデータを持っているべきで、それを
『どのように』選ぶかで悩むべきだと思うんだ。

今何となく思っているのは
『野球についての良いサイトを見つけたかったら、野球について良く知っている
人に聞くのが1番』だということ。

ほんと、よくわからん(藁
0082nobodyさん
垢版 |
04/02/24 05:07ID:UjHo5qOk
>>81
『どのように選びべきかで』という文と「俺は違うと思う」ってなんかおかしくない?
俺が感づいてないだけならすまん。。

>『野球についての良いサイトを見つけたかったら、野球について良く知っている
>人に聞くのが1番』だということ。

そのデータの”取捨て”が難しいわけで。データ量が多い=野球に詳しいってわけでもないし。
上でも書いたけどいくら検索エンジンが多くのデータを持つことが大事だとはいえ
”正確さ”ってのが大事なわけで。GoogleとYahooと比べて正確さなら明らかにYahooなわけで。
なぜなら人が見てカテゴリを判断してるからね。

俺も自分の話で悪いが「正確さ」を求める時はYahooでカテゴリ検索する。
上の例で言うと野球の有名な(情報量の多い)サイトを探したい場合、Yahooならあるが
Googleの場合、違うサイトが引っかかる場合があるからだ。漠然とキーワードが定まらない
場合はGoogleはいいけど、ある程度目的が決まっている場合はYahooになる。

このYahooの”正確さ”を手動ではなく自動で解析できるようになるといいんだけど
単にhtmlのtitleやmetaタグの文字を参考にするだけでは正確さが出ないしね。
なぜなら登録時に偽りのデータを書けるわけだし。
008377
垢版 |
04/02/24 05:36ID:???
>>82
>『どのように選びべきかで』という文と「俺は違うと思う」ってなんかおかしくない?
>俺が感づいてないだけならすまん。。
伝わらない? ごめん
要するに『どんなページでも登録できる』ことが『目的のキーワード
の検索結果を濁らせる』わけではないと思う、ということ。

どんなページでも登録できて、かつ良い検索結果を出すのが理想だよね。

今考えている方法だとデータの取り捨ては重要ではなさそう。

もしも、もしもだけど、Google利用者が毎回各検索結果に対して
得点付けをしたらどうなるだろう。
それで、利用者はGoogleに対して『野球が好きな人が付けた得点のみを
採用』するように設定する。正の得点も負の得点も(つけてないものは0かな)。

言い方を変えると「野球好きな人が良いと判断したサイト」に重みを
かけるようにする、ということ。

問題は大きく分けて二つ。
1. 得点付けなんて面倒なことしたくない(しかも自動化は難しい)
2. どのユーザが野球好きかなんて分からない

この両方が解決したら、楽しそうだよね。
一応頭の中では解決しているのだけど、別の問題が多々…。
0084nobodyさん
垢版 |
04/02/24 06:46ID:UjHo5qOk
>要するに『どんなページでも登録できる』ことが『目的のキーワード
>の検索結果を濁らせる』わけではないと思う、ということ。

なんとなく分かった気がするw

で、77の新提案だがそれはYahooのレビューサイト(本とかCDとか)を見ると答えが出ると思う。
あそこは2ちゃんからの荒らしが多いのか、めちゃくちゃだw
それに自分の検索結果だけを投票するようなスパム行為も行われることだろう。

俺が一番、検索システムで改善して欲しいポイントが「新規サイト」に関してだ。
Googleでも最近、登録されたサイトは上位にくる傾向にあるようだが
基本的に1ページ10サイト(Yahooなら20?)しか表示されないわけで
どう考えてもやったもん勝ちの新規参入がしにくい。

まぁ、実店舗と比較すると実店舗も中々大手には勝てないから地道にするしかないんだけど
ネットだとその差が激しいと思って。実店舗だととりあえず「新規開店時の優遇」があるけど
ネットの検索エンジンだとあまり効果が無い。まぁ、Yahooぐらいなサイトになると
新着サイトに載るのは効果があるけど、Yahooは手動だから論外なわけで・・。

何がいいたいかというともっと新規参入者が参入しやすい体制を作れないかな?と思うわけ。
そしてネットを数ヶ月していて毎回同じサイトばかり見ている人に
「こんなサイトが新しく出来ましたよ〜」っていう良い方法がないかな?と思って。
両方、提供する側・される側にとっても有益になると思うし。

うまくかけなくてごめん。。
0085nobodyさん
垢版 |
04/02/24 06:58ID:???
暇だからもう少しsageで書くw

いくつか手段を考えているがどれも解決しない。。

・ユーザー登録したユーザーに新着サイトを随時メールする
→うざがられてほとんど見ないと思う。

・検索するたびに新着サイトを表示
→限られている画面上では検索結果の情報と比べて限界がある。

・検索するたびに毎回表示されるサイトを変える(ランダム表示)
→検索エンジンの信頼性を欠く

・アクセス数、アップデート回数、投票数などで順位を決める
→不正が可能だし、cookieで制御しても数的に新規参入はなかなか上がれない
0086nobodyさん
垢版 |
04/02/24 07:41ID:???
んーでもできたばかりのサイトに情報価値はないでしょ。
008777
垢版 |
04/02/24 14:16ID:???
>俺が一番、検索システムで改善して欲しいポイントが「新規サイト」に関してだ。
>>86が言う通り新しいサイトだからといってみる価値があるとも限らないよね。
でもこれが「新規ページ」ということならば同意。
単純に「過去一か月にアップされたページ内から検索」ができたら面白いかも。
「新規ページ」はリンクもあまりされていないからなかなか上位に入りにくいからね。

>・検索するたびに毎回表示されるサイトを変える(ランダム表示)
これは*うまくいけば*面白いと思うけどな。
Googleにランダム用のボタンでも作っておけば楽しいかもしれない。
というかこれならGoogle APIで実現可能(シンプルな方法ならば)。

話は変わるけどGoogle APIってどれくらい利用されてるんだろう。
俺は.NET使えないから、使うとしたらJavaかぁ。
最初はGoogleのデータベースを利用して形にしてみるのも良いかもな。
0088nobodyさん
垢版 |
04/02/24 18:21ID:D2PfXOG1
検索エンジンの3つの答え

・カテゴリ型検索エンジン
・ロボット型検索エンジン
・人力検索エンジン
0090nobodyさん
垢版 |
04/02/24 22:18ID:???
そういえば、人力の結果がまだこない。
何検索したかも覚えてないぞw
0091nobodyさん
垢版 |
04/02/24 23:11ID:???
検索結果の表示にもいろいろとパターンがあるけど、どれが一番いいんだろ?
通常は

「サイト名」登録日
サイトに関する情報

で、Yomi-seachなら前にバナーを表示させたり、クリック数を表示させたりできるわけで。
”バナー”って個人サイトなんかだとそのサイトの色を示せるから結構、楽しいんだけど
逆に安っぽさがあったり、表示に時間かかったりするわけで。
かといって単に文字だけ表示だと文字に埋もれて醜いわけで。(電話帳のごとく・・。)

表示方法もそうだけど、表示件数も難しい。1ページ10件ぐらいが妥当だと思うが
逆にそれだと上位数ページしか見ないという問題も出てくるし・・。

検索結果の表示法ほうってのもかなり重要な気がする。
0092nobodyさん
垢版 |
04/02/24 23:24ID:???
もうサーチエンジンなんかいらねえよ
余計なもんがひっかかるだけだからやめろ
0093nobodyさん
垢版 |
04/02/25 01:15ID:???
>>91
一つだけ言えるのは検索結果の表示にバナーは必要ない。
バナーなんてサイト運営者のエゴ以外の何者でもない。
検索する人の立場になって考えましょう。

Yomi-Searchの作者は利用者への配慮に欠けてる。
検索結果の画面も見にくくてしゃーない。
0095nobodyさん
垢版 |
04/02/25 02:18ID:???
>>92
例えば本屋のサイトを作る時の検索システムでもいるじゃん。
別にYahooやらGoogleに対抗する為だけにあるわけじゃないし。

>>93
確かにそうだな。「面白い」と感じることがあっても見る人の立場には立ってないし。

なんしか、良い表示方法は無いかな・・。
0096nobodyさん
垢版 |
04/02/25 02:25ID:???
>>95
検索結果の表示はシンプルイズベストだと思うけどね。
「サイト名」登録日
サイトに関する情報
で十分だと思うけどねぇ。

関係ないけど最近見つけたアイデア検索エンジン
http://web-pasha.com/
0097nobodyさん
垢版 |
04/02/25 02:33ID:???
>>92
あるジャンルに特化した検索エンジンって必要だと思うよ。

例えば飲食店の検索エンジンがあったとして、最寄の駅、
扱ってる料理の種類、営業時間などを指定して検索できるとする。
これらはGoogleやYahooでは検索しきれないものだと思うんだよね。
(YahooにはYahooグルメとかあるけどね)

あるジャンルに特化した検索エンジンを作るというのは
検索エンジン戦国時代の今を生き抜く一つの手だと思う。
0098nobodyさん
垢版 |
04/02/25 02:37ID:???
>>96
そこいいね。実用向きかどうかは別にしてなんか面白い事してる。
そういえば、gooが3D検索みたいなのをはじめたっけ。あれと似てるな。

>検索結果の表示はシンプルイズベストだと思うけどね。
>「サイト名」登録日 サイトに関する情報 で十分だと思うけどねぇ。

確かに”十分”なわけだけど、なんか”物足りない”んだよね。
文字がただ並んでいるだけでは電話帳と変わりないし
サイトの説明文だけ見ても内容は開くまで分からないわけで
いまいち、合理性に欠けるというか。といいつつ、一番いいことは確かだけどね。。
0099nobodyさん
垢版 |
04/02/25 03:56ID:???
>確かに”十分”なわけだけど、なんか”物足りない”んだよね。
凄い分かる、十分だけど十二分じゃないんだよね。

でも同時に思うのは、検索エンジンはそれ自体は所詮ツールだから
変な個性よりも直感性が大事ってこと。

Kart00:http://www.kartoo.com/

これなんかは面白いけど、どう考えても実用的ではない。
俺はGoogleみたいな表示形式でもう少しサイトの要約が多く表示されると
うれしい。それこそ今の倍ぐらいの要約テキストがあってもいいぐらい。

それこそ2chブラウザで「>>1」の上にカーソル乗っけた時みたいに、サイト名
の上にカーソル乗っけるとサイトの全文(または一部)がポップアップするような
機能が欲しい。
0100nobodyさん
垢版 |
04/02/25 06:51ID:???
>>99
タイトルにマウスを載せたときに2chブラウザの要約みたいに
せめてmetaの内容でも出ると面白いね。

でも、そうなると基本的にはIE(ブラウザ)に依存するわけだから
プログラム的にはどうしようもないけどね。
Javascriptを使ってマウスオーバーにしてポップアップを表示して、とか出来そうだけど
これだとちょっと話が変わってくるし。。
0101nobodyさん
垢版 |
04/02/25 10:55ID:???
じゃあいっそのこと検索結果の表示をFlashで作っちゃうとか。
Flashの普及率は良いと言われているし、好きなUI実装できるよ?
0102101
垢版 |
04/02/25 10:57ID:???
Flashは>>99のサイトで使ってたみたいね。
0103nobodyさん
垢版 |
04/02/25 17:39ID:zi0n15ep
FLASHは実際、嫌われているからね。。
今後も復旧するだろうけど、見る人の立場になるとどんなもんかと。。
(TVCMの動画とか3Dが決して評判がいいわけじゃないのと同じで。。)

なんしか、「早い」「見やすい」「わかりやすい」
検索システムが必要なわけで。それもジャンルに特化した。
0104nobodyさん
垢版 |
04/02/25 18:00ID:???
グーグルで複数キーワード使って引っかけるのより効率良くないとなぁ。

と思うとなかなか難しいもので。
0105nobodyさん
垢版 |
04/02/25 18:07ID:???
FLASH使っちゃうとどうしても飛び道具になっちゃう。
本気で何かを探そうとしている時に「FLASHロード中…」なんてメッセージ
みたくないよね。

ジャンルに特化するのは良いと思うけど、特化しにくいジャンルはどうすればいい?
本や映画などのようなものは良いけど、「検索エンジン アルゴリズム」みたいな
キーワードで検索したい時はジャンルは何? 「プログラム」ってジャンルは広すぎる
し、「検索エンジン」じゃ狭すぎる。

こういう時にどうしても「オールジャンル」な検索エンジンが必要になる。

それはともかく…
Google APIを使ってGUIな検索ツールっていうのはどうだろ?
ブラウザ密着でなくなるから使いにくくなるかな?

おまけ:http://www.mamma.com/index.html(以外といい感じに使える…)
0106nobodyさん
垢版 |
04/02/26 02:40ID:???
>ジャンルに特化するのは良いと思うけど、特化しにくいジャンルはどうすればいい?
そうゆうのはGoogleにお任せで。
0107nobodyさん
垢版 |
04/02/26 10:21ID:???
次はフリーの検索エンジンスクリプトについて語ろうか。
0109nobodyさん
垢版 |
04/02/26 14:55ID:khyHj+7H
>>108
だって君達検索エンジン作るって言ったって
YomiとかCosmoNaviとかの既存のスクリプト使って作るんだろ?
それとも一から自分で作るのか?
0110nobodyさん
垢版 |
04/02/26 15:00ID:QRXddEDf
            __,,,,_
            /´      ̄`ヽ,
            / 〃  _,ァ---‐一ヘヽ
         i  /´       リ}
          |   〉.   -‐   '''ー {!
          |   |   ‐ー  くー |
           ヤヽリ ´゚  ,r "_,,>、 ゚'}
         ヽ_」     ト‐=‐ァ' !
          ゝ i、   ` `二´' 丿
              r|、` '' ー--‐f´
         _/ | \    /|\_
       / ̄/  | /`又´\|  |  ̄\

    俺様がみあか様だーよ キヒヒ
     悔しかったらここまできな
http://school.2ch.net/test/read.cgi/senmon/1074344178/l50
0111nobodyさん
垢版 |
04/02/26 19:53ID:???
>>109
一から作るからこのスレで話してるんだろ
0112nobodyさん
垢版 |
04/02/26 23:27ID:???
>>111
嘘?マジで?
Yomi-SearchとかCosmoNaviとかAmigoNavigatorなどの
既存の検索エンジンスクリプトを使わないなんてすごいね。

ちなみにもう自作のスクリプトは動いてるのかなみんな?
0113nobodyさん
垢版 |
04/02/27 03:06ID:???
>>112
ていうか別に凄くないじゃん。なんでそう思うの?
検索エンジンにもいろいろあるし。何か大きなの想像しすぎてない?
0114nobodyさん
垢版 |
04/02/27 11:14ID:???
>>113
Yahooのようなカテゴリ型の検索エンジンの話と仮定すると
あのYahooのカテゴリの階層ってどのように管理すればいいのかとか
カテゴリのショートカットはどうしようかとか結構大変でしょ?
0116nobodyさん
垢版 |
04/02/28 17:31ID:+L9rAJmN
自前で検索エンジン作った人は環境を教えれ。
0119nobodyさん
垢版 |
04/02/28 23:15ID:+L9rAJmN
>>118
やっぱり自前で作る場合、Yahooレベルのものを作るのは無理かな?
0120nobodyさん
垢版 |
04/02/29 01:44ID:???
Yahoo! も dmoz もそうだけど、カテゴリのメンテナンスは人力だからね。
精度を気にしないなら GETA とか使ってクラスタリングするといい。
0121nobodyさん
垢版 |
04/02/29 01:45ID:???
Yahoo!なんて何人体制でやってんのかな?
0122nobodyさん
垢版 |
04/02/29 05:52ID:???
Yahooの、親がソフトバンクだった事を最近しりますた。
0123nobodyさん
垢版 |
04/02/29 10:38ID:???
>>122
君はWebプログラム板にいちゃいけない人だ。
0125nobodyさん
垢版 |
04/03/03 01:18ID:lXnthRs5
2ch発検索エンジンが出来て欲しい上げ
0126nobodyさん
垢版 |
04/03/03 13:22ID:???
http://gamble.x10.jp/
このエンジンは気持ちは分かるが、作りこみが今一かな
更新作業が楽そうで本当は手を焼いてるんじゃないかと思う
0127nobodyさん
垢版 |
04/03/03 20:52ID:???
で?ここまで来たら作るぞ喪前ら。
0128nobodyさん
垢版 |
04/03/03 23:21ID:lXnthRs5
お前等が作ろうとしてる検索エンジンってのはどうゆうの?
カテゴリ型なのかロボット型なのか。
使用言語は何か。データはテキストで扱うのか、それともDBに格納するのか。
0130nobodyさん
垢版 |
04/03/04 05:13ID:naRm3zqc
最大登録件数をどのくらいで見積もるかで検索速度やスクリプトの内容が大きく変わる。
yomi程度なら誰でも簡単に作れるだろうし、自分で作った方が自由度は高い。
一番の問題は登録するデータをどう増やすのか。
検索サイトを作ったは良いが、登録データが増えず放置されるケースが多い事!
0131nobodyさん
垢版 |
04/03/04 05:50ID:???
>>128
俺はカテゴリ型でPHP+MySQLで目標10万件を予定してます。
>>130
登録データが増えずに放置されるケースの対策はほぼ出来ている。
もちろん、Yahoo!やGoogleと対抗するのはおかしいが
中規模の検索サイト並みの情報を保てるだろう。

問題は上でも出てきたけど、+αの機能。
ようはユーザーに「迷った時にはここに来よう」と思わせるような検索エンジンであるべきだ。
そう思わせたらお気に入り登録→ホーム登録へとなりやすいだろうし
1年後・2年後には反響も出て商売としても成り立つと思う。

ところで問題の+αの機能。俺が良いと思うのは各検索ごとにRSSのような
ニュース記事が表示される機能。例えば、「パソコン」で検索したら
パソコンに関連したニュースが出るような。すでにどこかが行っている可能性もあるけど。
0132130
垢版 |
04/03/04 07:58ID:naRm3zqc
中規模の検索サイトがどこだと言われて思いつかないが分かる方、
教えて下さい。凄く気になる
+αはカテゴリを絞るのが良いんじゃ無いかと思います。
間口を広げると特徴を出すのが難しく、収拾不可能に成るかも知れないです。
0134nobodyさん
垢版 |
04/03/05 19:30ID:N0xwB9R1
JOYが中堅か。確かによく見るサイトだな。
でもどんなところが検索エンジンとして良いんだろう?
0135130
垢版 |
04/03/05 20:51ID:SabcyS9O
正直、フリーの検索エンジンスクリプトを使ったのが大量にあるので、
検索サイトも見慣れた感じがあるのと、アクセス支援のためだけの検索エンジンが増えて、
検索サイトへの興味が薄れて来てる。
ユーザが使おうと思うのがほとんど無くて、アクセス支援の登録のためだけに存在する検索エンジンは不必要。

なんかスレッドフロートBBSを設置すれば人が集まると勘違いしてる人と同じな状況でもあるのかな?

JOYは中堅なんですね。古くからあるところは老舗っぽくて存在は知ってても使わないのが寂しいkな。
検索エンジンの大手・中堅とかのセグメント分けをしたリストがあれば面白いけどね。
検索サイトの検索エンジンとかメタサーチとかも今一だし、大手ポータルには敵わないのかな。
そういえば、韓国系のWAKANAって今あるのかな?
0136130
垢版 |
04/03/05 20:56ID:???
www.wakanao.co.jp
WAKANOだった。WAKANAじゃないのね。
でもここ重たくて機能してないみたい。
0137nobodyさん
垢版 |
04/03/05 20:57ID:???
思うんだけど、アクセス解析を付けている人なら分かると思うけど
gooもinfoseekもフレッシュアイもその他の検索エンジンも
Yahoo!やGoogleには到底及ばない。100:1いや、1000:1かもしれない。

なぜgooやInfoseekが出遅れた(もしくは越された)かと言うと
企業的な思惑はあるにせよ、Googleと比べて圧倒的に検索されるページと
検索時間が劣るからだ。逆に言えば、Googleはそれに特化して
現在の地位を保っていると言っても過言ではないと思う。
Yahoo!は「検索エンジン」というよりはすでにインターネット=Yaoo!になってきているから
全く別問題だと思うが。

それで、これらに対抗しようと思ってもいくら人や金があっても無理。所詮”猿真似”だからね。
では、どうすればいいのか?というとオリジナルの「何か」が必要なわけで。
検索エンジンとはとか違うけどblogなんかはかなり参考になると思う。
0138nobodyさん
垢版 |
04/03/05 21:04ID:???
あともう一つ。検索ページが取りざたされているけれど、問題は
やっぱり量より”質”だと思う。
SEOにも当てはまるがユーザーにとっては「知りたいページ」が見られたら
それで言い訳で、知りたいページ・類似したページは多くても10ページあればいいわけで。
という事は検索した際により多くの情報が出るよりはより「ユーザーの考えにあったページ」
が検索結果に現れるといいわけだ。

こうなるともう、ブラウザにATOKのような機能を付けて
検索ワードの保護をしてやらないといけないわけで・・・M$任せになるな。。
0139nobodyさん
垢版 |
04/03/06 00:45ID:mLIiHzki
誰か自分の作った検索エンジン晒す香具師いない?
0140nobodyさん
垢版 |
04/03/06 00:48ID:???
作ってるヤシ少ないんじゃない?

それなりに長期に渡って運用していかないとデータ量すくないし、

逆に、データが増えたらとてつもなく膨大になるし・・・
0141nobodyさん
垢版 |
04/03/06 01:20ID:???
きょうび、そんなもん作るより、
googleのデータを何とか整理すればと思うが・・・。
0142nobodyさん
垢版 |
04/03/06 03:09ID:???
ちょっと違うかもしれないけど、Amazonにアカウント登録してると、
最近チェックした商品をもとに、マイページみたいなところでタイプの似た商品なんかを上げてくれるんだけど、
検索エンジンにも、そんな風に以前の検索結果と似たタイプのものを出してくれると、
知りたいページが得られるとか思った。

ついでに、とても中規模に収まらないと思った _| ̄|○
0143nobodyさん
垢版 |
04/03/06 06:23ID:???
>>142
おれも同じ事考えている。別にアカウント登録して無くても出来る見たいだし。
概念としては検索エンジンにキャッシュ機能みたいなのをつけて
検索ワードで判別して付随ページを抽出すれば。

中規模で収まる気がする
レスを投稿する


ニューススポーツなんでも実況