掲示板の汎用ログフォーマット規格を作ろう!
住人の力を合わせてログフォーマット規格を作りませんか?
規格を作れば掲示板の移行なども容易に実現できます。
以前も同様のスレッド作りましたがいつの間にか消えてました。
http://pc.2ch.net/php/kako/1035/10359/1035908481.html
デリミタは何にするか
エンコーディングはどうするか
XML化しちゃうけ?
参加してくれる方がいましたら
公式サイトでも立ち上げて本格的にやりたいな・・・と。
記録するべきデータとデータ構造について考えるべき
相互変換可能なフォーマットなんか規定するのはナンセンスつかどうでもいい とりあえず思いつくものを。
名前 UA HOST コメント タイトル 書き込み日時 メール
てかスレ式にするのかツリーにするのかリストにするのかどれなんだい。 なぜ、atomじゃダメなの?
まず >>1 は既存のフォーマットをサーベイして比較検討した結果を示してね。
そうすりゃ漁スレ^h^h^h良スレになれる! > なぜ、atomじゃダメなの?
意味が解らない。もしや掲示板のソースをatomの中に放り込むって言う馬鹿げた手段に出るつもり?
atomってそういうように作られてたっけ? 「ログ」でないなら汎用のフォーマットは作れるかもしんないけどね。
OPML みたいな感じで交換時に使うってんならね。
でもログはその利用方法に応じて変わるだろ。
ログフォーマットっていう言い方からしてファイルベース
なんだろうけど、1ファイルで納めるかどうかも利用方法に
応じて変わると思うんだが。で、そういうのはあとで考えるよっ
て連中はとりあえずデータベースに全部投げるとかそういう
発想になっちゃうわけ。
フォーマットありきなんて考え方をログに当てはめるのは
ナンセンスだと思うがなぁ。 >10
> 1ファイルで納めるかどうかも利用方法に応じて変わると思うんだが。
これについては、>5 で書かれてるHOST情報などですね。
HOST情報など、簡単には表に出せない情報まで1ファイルで扱うと
専用ブラウザ対応の問題で面倒になる。
実際、そういうサイトもあるし。
・XMLでログファイルの具体的な仕様を定義。
(国コード・文字コード・グループ・作成者・表題・提供元URL・作成日時・最終更新日時・総レス数・各列の概要 etc.)
例)イメージとしてはこんな感じ
[国コード:JP] [文字コード:Shift-JIS] [所属:2ch WebProg] [作成者:nobody]
[表題:掲示板の汎用ログフォーマット規格を作ろう!] [提供元URL:http://pc8.2ch.net/test/read.cgi/php/1131793084/]
[作成日時:2005/11/12 19:58:04] [最終更新日時:2005/11/16 00:18:59] [総レス数:11]
[各列の概要:no name trip mail date(YYYY/MM/DD hh:mm:ss) id text](←アイコン掲示板用に、iconとか定義しちゃっても面白いかもな)
・ログファイルはCSV形式で送出する。
(他にも数種類使えるのを用意して、XMLの方で指定してやるってのもアリか。送出時に変換してやるなら、鯖側のログファイルの扱いは自由だし)
専ブラは必要なログの範囲(例えば100〜全て)に加えて、必要な列情報をリクエストとして送信。
鯖の処理に余裕があって帯域に余裕がなければ、必要な範囲だけを抜き出し圧縮して送信すれば良いし。逆なら(略
何となく書いてみたけど途中で飽きて、雑になった。
まともにやろうと思ったら、こんなチラシの裏みたいなのじゃなくて、もっと練らないと使い物にならんね。 >12
専用ブラウザに関して言えば、ログ範囲はレス単位ではないです。
取得済みログのBytes数で管理されており、「〇Bytes目から続きをくれ」
みたいなリクエストになります。(あくまでも現状は、という話ですが)
そこから考えた場合、通常はデータベースに放り込んでおいてという手法だと
現状のBytes指定のリクエストは難しいということになるのかな。
現在の2chの仕様に合わせないといけないって訳ではないので
ここでの定義としては、「レス単位で指定するのだ」としても良いわけですが
既得分に「あぼーん」があった場合とか、ログ取得がCGI経由になり重くなるとか、
いろいろ懸念事項がありそうです。
掲示板訪問者のうち、専用ブラウザ使用者の占める割合は案外低いけど
専用ブラウザが対応されていない掲示板は、流行にくいと思いますので
難しいっすね。 静的な情報しか入ってないログなんかより、
Web 2.0 時代の掲示板とか、
そういう方向に発想した方が面白いんじゃねーか?
専用ブラウザとかより RSS, Atom にどんな情報出すと
便利かとかさ。OpenSearch に対応した掲示板とか。 スレの群れの中で消えていくかと思ったら、意外とまともな流れになったね。
OpenSearchに対応したりと検索系に力を入れた掲示板とか良さそうだし作りたいけど、俺はまだ経験が浅くて力量が伴ってないからなぁ・・。
もっと勉強して精進せねば 公開/保留/あぼ〜んフラグは欲しい。
あるいは、保留投稿とかゴミ箱行き投稿を別ファイルに持たせるのでも良いけど。
スパム投稿対策には、URL検閲機能と証拠保全機能があると便利だとつくづく感じる。 欲しいデータ
■ インデックスファイル
投稿日時 / 編集日時 / 投稿時 IP / 編集時 IP
記事 ID / タグが有効なのかプレーンテキストなのかのフラグ
文字コード / 改行コード / 言語
パスワード / 暗号化の有無 / 暗号化の方法 / 暗号化の際のパスワード (password とはまた別)
記事を別ファイルにするのでそのファイル名 (ファイル名はランダムでユニークなのが望ましい)
※ インデックスファイルは最新の投稿が一番下
■ 記事データ
インデックスファイルをリビルドする際、記事の時刻を posttime で扱うか edittime で扱うかのフラグ
今流行りのタグとやらをカンマ区切りか[]でかこって羅列
投稿者名 / メールアドレス / ホームページ / 件名 / 本文
※ 記事データにはインデックスファイルに記述するデータを全て含む。
※ というのも、インデックスファイルがぶっ飛んだ時にインデックスをリビルド出来るようにするため。
先に必要と思われるデータは列挙しておいたほうがよい。
あとからデータを追加するのはかなり面倒だし、フォーマットがぐちゃぐちゃになって使いづらくなるだけ。
(RSS なんかが反面教師としてはいい例かと思う)
>>19
それって、わざわざ移行を検討させる程に魅力的ですか? そのDBに入れるデータ構造をうだうだ話すスレだと思うのだが?