An Infinite Latent Attribute Model for Network Data[Palla+, ICML'12]のざっくりメモ

http://icml.cc/2012/papers/785.pdf
ネットワークデータのようなオブジェクト間の関係データをモデル化して,潜在的な構造を発見しようとする研究.お酒飲んで適当なことを書いているかもしれないけれど,悪しからず.

  • 先行研究
    • Infinite Relational Model(IRM)
    • Mixed Membership Stochastic Block Model(MMSB)
    • Latent Feature Infinite Relational Model(LFRM)
      • 各オブジェクトは複数のクラスタに属すると仮定して,feature vectorで所属を表現.
      • 今回はこれが直接的なライバル
  • モチベーション
    • LFRMはオブジェクトをフラットクラスタリングで説明する
      • クラスタは階層的な方がもっと良い
        • スポーツは,バスケットボールやテニスに細分化出来るように
      • サブクラスタを考慮するモデル化へ
  • 提案モデル: Infinite Latent Attribute model(ILA)
    • 各オブジェクトは可変長Mの特徴(二値)ベクトルzを持つ
    • 一つ一つの特徴mは可変K(m)個のサブクラスタを持ち, c_i^{(m)}でノードiが特徴mでどのサブクラスタに所属するかを表す.
    • Wはある特徴mにおいてサブクラスタ間でのリンクの付きやすさの重みを表す行列
    • ノードiとjの間でリンクが付く確率は,それぞれのノードが持つzと重みの線形和のロジスティックシグモイド.
    • #言葉で説明するのは難しい.
  • 学習はMCMC
  • 計算量の比較
    • 尤度の計算に関して
      • LFRM: O(M^2 N^2)
      • ILA: O(M N^2)

時間切れのため以上.