Richard Halstead-Nussloch
The Design of Phone-Based Interfaces for Consumers
Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI'89), pp. 347-352, May 1989
電話をインタフェースに使う(Phone-Based Interaction:PBI) ときのガイドラインについて。 ○ 電話の特徴 ・音声入出力しかできない ・どこにでもある ○ 電話のインタフェース ・入力:キーパッドまたは音声 出力:録音音声または合成音声 ・対話型式(プロンプトの方法、対話の構造、...)の設計がむずかしい ○ Self Help: 電話による計算機のガイダンスシステム ○ 入力 音声認識では以下の条件が満たされるところのでないと使えない (本当か?異論がありそう)ので、電話のキーパッドをもっぱら使用 することにする。 ・目または手が使えること ・特定話者 ・トレーニングの時間が充分あること ・語彙が小さいこと ・静かなところで使われること ・認識を間違っても被害が少ないこと ・間違いをみつけるのと訂正するのが簡単なこと ○ 出力 可能なかぎり録音音声を使うのがよい 合成音声を使うときは、 ・メニューを示す場合は、示される単語についてユーザが 前もって知っていることが必要 ・ユーザをあらかじめ合成音声に慣らせておく ・ユーザが合成音声の抑揚に慣れるようにするため、最初に 冗長な文句を付加しておく。 ○ 対話方式の選択 ・コマンドベースとプロンプトベースの2種類が可能。 ・コマンドベース 以下のようなとき使うのがよい(c.f. SFS[4]) ・モード数が少ない(4ー5) ・モード内では多くの機能がある ・ちょくちょくモードを移動する ・そのPBIがよく使われる ・プロンプトベース 以下のような場合に使う。Self Helpはこちらの場合に属する。 ・モードが多い(6以上) ・モード内の構造は単純 ・モードの移動があまり行なわれない ・PBIがたまにしか使われない ○ プロンプト ・初心者には詳しい音声メニューを使い、熟練者には何も言わ なくてよい ・熟練者の場合でも、メッセージの途中で割り込み可能ならば 音声メニュー方式でも問題ない。 ・音声メニューはメニューのタイトル、選択枝、終了メッセージ で構成する。タイトルによって自分が今どこにいるのかを知らせる。 ・「To do function X, enter Y」というメッセージを使う。 ("Enter Y for function X"とはしない。日本語なら自然にこう なるだろう。) ・初心者にとっては音声メニュープロンプト方式が一番である。 ○ メッセージでシステムの状態を知らせる。 ○ ユーザに選択させるとき、よく使われるものは最初に出す (あたりまえ?) ○ 音声認識が便利な点 →CHI87のパネル[2]を参照
・こういう電話インタフェースだと盲人でも使えるはず。 ・それにしてもこんなあたりまえのような話が論文になる? ・米国の大きな会社に電話するとこの手の音声メニューで応答 されることがある。(ヨセミテに宿を予約しようと思ったら 全然つながらないうえにやっとつながったと思ったらこの手の 電話で応対されてしまった。メッセージがわかりにくいのを我慢 してやっと予約デスクまでたどりついたと思ったら「満室です」の ひとこと。Fuck you! 最初から人間が応対せい!) ・確かにどこのシステムも「To do something, press X」とは 言っていた。だからといって嬉しくも何ともないが。 ・銀行の「Bank by Phone」というシステムを時々使っていた。 預金残高が電話で調べられて便利。音声メッセージ+キーパッド で操作するが、熟練者は最初からメッセージを無視して コマンドをバシバシ入力して一度で目的の応答を得ることが できるので結構便利だった。(国際電話でも使えるのかしら)

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声 CHI89発表論文