全力でgoogle八分ならぬgoo八分されてますが。
ただいま待ち時間。gooラボのブログ通信簿イベント待機中。 on TwitPic
リアルタイム更新できるかな?
バッテリーが持つ限りですがw
いろいろいってたけど、これだけが重要です。
と、それはそれで、あれなので、適当に解説。
主に発言ほぼそのまんま。
再構成めんどい。
ブログ通信簿に使われている技術をもとに、新しいサービスを考える。
対象ブログ記事
最新の10件の記事を参照
そのまま情報を取得しないでgooブログ検索エンジンが集めたブログ記事を解析している。
・主張度
記事中の文全体にしめる意見文の割合
意見性判定技術
主に文末に含まれる表現を元に、文が意見を表しているかどうかを判定する技術
意見
評判、推量、要望、主張
・気楽度
記事中の評判情報のうちポジティブな情報から算出
評判情報抽出技術
評判に関する表現を抽出して、ポジティブネガティブを分類
NTT研究所が作った辞書から判断。
・マメ度
平均投稿時間をもとに算出。
・影響度
「すごい」ブロガーかをもとに算出
EigenRumor
リンク情報を元に記事とブロガーに対してスコアをつける技術
gooブログ検索の結果の右側にあるのが参考数値。
・通信欄の文言
・タイプとメッセージ
4つの値を元に決定
生徒会役員5種類
委員11種類
一般生徒
・話題
記事タグ推定技術
記事から特徴後を取得し、その特徴ごと関連の深いタグを推定する技術
もっとも関連度の高いタグを話題として表示している。
・職業
文書ドメイン判定技術
記事に含まれている単語の分野から記事の分野を求める技術
事前に、各職業についての説明文に含まれている単語の分野から各職業の分野を決定し、解析対象の記事の分野に近いモノを表示
たとえば、
パティシエ......菓子職人
・ブログ性別/ブログ年齢
文書属性推定技術
事前に、ブロガーのプロフィール情報を参考にして性別や年代ごとに、ブログ記事から特徴的な言葉を取得しておく。
その上でそれらの単語を抽出して、決定する。
事前に特徴後の辞書を統計的に作成する。
10代 or not 10代
20代 or not 20代
を繰り返す。
どれくらいその年代のらしさがあるか、


昨日はお世話様でした。
名刺交換させていただいた「のりさ」です。
Movable Type使っているんですね。
ブログ通信簿とは相性よくないのでしょうか?
あとでまたトラックバック送らせていただくかもしれません。
そのときはまたよろしくお願いします。