概要 実装例 技術詳細 Palm版 Emacs版 POBox Server 辞書 日記 POBox ML 関連情報
辞書
概要
辞書データ
変換ツール
POBoxの辞書は 実装によってどのような形式のものを使ってもかまいませんが、 システム依存の辞書は テキストの交換データ形式をもとにして作成します。

交換形式辞書フォーマット

  • 交換形式の辞書は、 1エントリを1行で表現したテキストファイルです。
  • ひとつのエントリは以下の形式をとります。
    パタン文字列 単語 {コンテクスト}
  • パタン文字列単語コンテクストはタブ文字(0x08)で区切ります。
  • コンテクストは省略可能です。
  • 上記以外の形式の行はコメントとして無視されます
  • 使用頻度の高いエントリほどファイルの先頭の方に置きます
  • パタン文字列は単語を検索するために使われる文字列で、 日本語辞書の場合は通常単語の読み(e.g. tango)、 英語の場合は単語そのもの(e.g. user)が パタン文字列になります。
  • あらゆる辞書において パタン文字列はASCII文字で表現します。 日本語の読みを表現する場合はローマ字を使用します。 かな文字を検索に使用するシステムでは パタン文字列をかなに変換した辞書を使用します。
  • 単語は入力される単語そのものでもかまいませんし、 図などを示すファイル名でもかまいません。
  • コンテクストは単語の直前に 出現する可能性が高い文字列です。
  • 漢字コードはJIS/SJIS/EUCどれでもかまいません。
  • 改行コードはCR/LFでもLFだけでもかまいません。
単語辞書と例文辞書を分けている実装がありますが、 交換形式では両者を区別しません。 コンテクスト情報を含むエントリから例文辞書を、 含まないエントリから単語辞書を生成することができます。

交換形式辞書の記述例

交換形式辞書の例を以下にいくつか示します。

日本語辞書の例

# 日本語交換辞書の例
# この行はコメントとして無視される
tango	単語
kanji	漢字
kanji	感じ
onegai	お願い	よろしく

英語辞書の例

# An example English dictionary
user	user
interface	interface	user
to	to	in order

アイコン辞書の例

単語のかわりにファイル名を使うことにして 絵文字POBoxに使うことができます。
masui	icons/masui.gif
hikouki	icons/airplane.gif
Up$Date: 2001/08/01 04:43:04 $