[ブクマ]ブックマーカーをタグで分類する

[ブクマ]ブックマーカーをタグで分類する - TODO

llameradaの日記 - クラスタリング技術を使った「はてなブックマーク」でのお気に入りユーザ数ランキング(簡易ジャンル別)

http://b.hatena.ne.jp/entry/http://d.hatena.ne.jp/llamerada/20060508/1147105471

引っかかったものを何でもぶち込めるのがブクマの利点なのだから、タグを指定して「お気に入り」に入れられない時点で「お気に入り」による分類はかなり大変そう。

どっちかというと、ジャンルというよりかは「お気に入り」機能を使っている人たちが見ている範囲を「島」として可視化したものだったんだろうけど「簡易ジャンル別」と付記したのが誤解を招いた形かなぁ。

特定ユーザーのタグ単位のRSSを「お気に入り」に入れる機能がつけば話は別だけど。


ブックマーカーを分類するならおそらくタグでやるのが順当

  • どんなタグをどのくらいの頻度で使用しているかを元に、そのブックマーカーに付くタグが決まる
    • 要するにタグクラウドの中の大きいタグ
    • タグつけないブックマーカー(独自タグが多すぎるブックマーカーも)はブクマしているエントリのタグクラウドから抽出して代用
  • タグの相関関係で、タグ単位の近似値を求める←クラスタリングはむしろここで使うのに向いてる感じ
  • 付いているタグの近さがブックマーカー同士の近さ
    • 代表的なタグで絞り込んだうえで、そのタグの含有濃度でソートできると便利そう
      • [読書]関連タグをよく使うAさんのブクマは100/1000が[読書]エントリなので含有度10パーセント、とか。


…[妄想だけなら猫でもする]

ある程度は目視で何とかなりそうだけどそんな根性は無い


同じこと考えてる人発見 2006-05-11 06:37:03

http://fragments.g.hatena.ne.jp/fukken/20060510/1147280771

そうか機械がやるとデータ量が膨大すぎるのか

[Good Job!]