ベクトル空間モデル

  • 出現頻度にもとづく単語の重みづけ
    • Wij = TFij * IDFi
    • TFij = (term freq) 文書j中の単語iの出現頻度
    • IDFi = (inverse term freq) log(N/DFi)
      DFi = 全文書中の単語iの出現頻度