PPM法 [Witten]

  • 文字出現頻度情報から次の出現文字を予測
  • Predict next character based on history
  • テキスト圧縮に有効
  • Used for text compression
    • 予測が正しいほど高圧縮率
    • Good prediction => good compression ratio
  • e.g. abracadabraに続く文字の予測
    aの後には bが2回, c, dが1回ずつ出現した実績があり,
    raの後には cが1回出現した実績があり,
    braの後にも cが1回出現した実績があるといった出現頻度の荷重和をとって次の文字の予想出現確率を計算