ベクトル空間モデル

  • 出現頻度にもとづく単語の重みづけ
    Wij = TFij * IDFi
    TFij = (term freq) 文書j中の単語iの出現頻度
    IDFi = (inverse term freq) log(N/DFi)
    DFi = 全文書中の単語iの出現頻度