ICML2011の読むかもしれないリスト

正確に言うと、ICML2011の読んでみたいけど読めるかなリスト。読み会で読むためのリストアップではなく、個人的に。

  • Dynamic Egocentric Models for Citation Networks (pdf)
    • Duy Vu, Arthur Asuncion, David Hunter, Padhraic Smyth
    • ネットワークの形成と時間による進化の分析は、いろんな分野で基本的な重要項目である。長期間のネットワークデータセットがあるのに、多くの研究ではある時期のデータしか使っていない。この論文では、多変量計量プロセスを使って連続時間のネットワークデータをモデル化する動的エゴセントリックフレームワークを導入する。推論においては、我々の方法が大規模なネットワークデータに対してもスケールするように、効率的な部分尤度アプローチが使われる。我々はこのテクニックを様々な引用ネットワークに適用し、予測の力と学習した統計的モデルの説明可能性について示す。
  • Large Scale Text Classification using Semi-supervised Multinomial Naive Bayes (pdf)
    • Jiang Su, Jelber Sayyad Shirab, Stan Matwin
    • 数多くの半教師学習法はラベルづけされてない文書を使ってMultinominal Naive Bayes (MNB)を増やすことを提案してきた(??)。しかし、実装の難しさや一貫性のない予測性能、または高い計算コストためにそれらの使用には制限がある。 この論文では、Semi-supervised Frequency Estimate(SFE)と呼ばれる新しくてとてもシンプルな半教師のMNBの拡張を提案する。我々の実験では、提案法がAUCと精度の観点から追加データ(ラベルあり or ラベルなし)でMNBが改善することを示す。我々はこれの要因をEM+MNBやラベル付きの学習データによるMNBよりも、SFEがよりよい条件付き対数尤度を常に生成することにあると思っている。
  • Preserving Personalized Pagerank in Subgraphs (pdf)
    • Andrea Vattani, Deepayan Chakrabarti, Maxim Gurevich
    • 巨大な現実のネットワークを簡易に表現する部分グラフを選ぶことは、多くの場面で役に立つ。よくある戦略は元のグラフの次数分布やクラスター係数などにマッチするサブグラフを誘導するノードをサンプリングすることである。しかし、クラスタリング、分類、ランキングのアプリケーションに重要なノード間の関係をきめ細かく保存するような試みはない。この研究では、Personalized PageRank Value (PPV)の考えに沿って上記の関係をモデリングする。我々は、今あるサンプリング法によって誘導された部分グラフの出力はPPVを保存していないことを示し、あらゆる与えられたノードの部分グラフ上でPPV保存部分グラフを作るためのアルゴリズムを提案する。3つの現実の強大なネットワークによる実験では、提案法によって作った部分グラフが、PPVの保持やクラスター精度、基本的なグラフの性質の保持の観点から誘導された部分グラフを改良することを示す。
  • Sparse Additive Generative Models of Text (pdf)
    • Jacob Eisenstein, Amr Ahmed, Eric Xing
    • テキストの生成モデルでは全てのクラスやトピックで多項分布を想定している。シンプルなモデルの場合でさえ、数千ものパラメータ推定を要求される。この論文では、テキストのついての代替の生成モデルを提案する。中心となるアイデアは、全てのトピックとクラスは定数の背景分布から対数の頻度における偏差のモデルによって与えられる。このアプローチでは2つの優位な点がある。1つは、過学習をさせずにスパースを実行出来る。もう1つは、隠れスイッチ変数が必要に鳴るのを避けて、対数空間で簡単な足し算で生成ファセットを組み合わせることが出来る。我々は、分類、トピックモデリング、より複雑な多面的な生成モデルのシナリオの範囲に対して、このアイデアの適用性を示す。
  • Predicting Legislative Roll Calls from Text (pdf)
    • Sean Gerrish, David Blei

なんか、こうやって読みたい論文探してると自分のやりたいことがだんだん分かってくるような気がするので、これからいろんな会議の読みたいリストを作るといいのかも。でも、当然ですけどネットワーク科学の研究室で2年やってきているのでどうしてもそっち系の論文に目が行く。勉強2ヶ月目のNLPはまだまだアウェイです。また今度、WWW2011も見てみます。