名称未定ドキュメント"Que"

ゴーゴーカレーでロースカツビジネスルー増し頼んでキャベツを4回おかわりするブログ

デザイニングボイスユーザーインターフェース

オライリー・ジャパン様より献本いただきました。ありがとうございます!!

原著の方を先に読んでいて、すごくいい本なので日本語版でないかなーーと待ちに待っていたこの本。翻訳もすごくわかりやすく、読みやすくていい本でした。

Alexaと私

Voice User Interfaceと聞いてみなさん Amazon EchoGoogle Homeを真っ先に思い浮かべるかもしれませんが、それよりも前に実は多分、みんなVUIには触れていたと思います。それは、宅急便の再配達依頼の電話のあれ。音声ガイダンスに従って「当日再配達を希望の方は”1”を」とか言われてプッシュボタンを押すアレです。あれこそ、一番身近なVUIです。

とはいえ、VUIを一気に一般的なインターフェースにしたのはAmazon Echoであり、Google Homeでしょう。自分は仕事でAlexa Skillを作っている ということもあり、日本でのEcho発売以来ずっとAlexaを触ってきました。自宅は3DKなのですがEchoデバイスが4台鎮座しているというしまつ……。最初は「はー、声でいろいろ操作するの楽だわーー」くらいの雑な感じにしか思っていなかったのですが、第二世代のEcho Showが日本で発売され、それを自宅に導入してから生活が一変しました。

スマートスピーカーは画面付きが圧倒的にいい。まさかここまで違うとは、使ってみるまでは思ってもみませんでした。画面なしのスマートスピーカーの問題点は「使い方がわからない」という点に尽きます。

人間というのは不思議なもので、自由を欲する割に、自由にしていいと言われると何をしていいのかわからなくて何もできなくなるものです。いざ、Echoデバイスを目の前にすると、「Alexa。えっと……。……」と、こっちがフリーズしてしまいがちです。そして、だいたい天気とニュースを聞いてそれでおしまい。みたいな。

しかし、画面付きのデバイスだと、アイドル状態のときに「アレクサ、百人一首を詠んで。と言ってみてください」のような、「〜〜ができますよ」という表示が、日々のニュースと一緒に合間合間にながれてきます。これが素晴らしい。これによって、この得体の知れないAlexaという存在が何ができるのかということを例示しつつ、興味があればユーザが自分でAlexaが何ができるのか調べるきっかけができる。この体験に僕はすごく感動しました。

もちろん、それだけじゃないです。Amazon Primeに入っていればPrime Videoで配信されている動画をEchoShowの画面+無駄に高音質なスピーカーで堪能することができるし、Amazon Musicで配信されている楽曲の再生もできる。歌詞表示に対応している曲なら歌詞が歌に合わせて表示され、カラオケ練習だってできる! 電気自動車のLeafをお持ちの方なら、自宅にいながらお出かけ前にクルマのエアコンをAlexaで付けておいて、クルマに乗る頃には温まった車内にのりこめる!

素敵! 素敵でオシャンティな生活!

そんな素敵でオシャンティな生活の手助けをするのが、AlexaにおけるSkillという、どこかの誰かが作ったアプリであり、このアプリを作る人は 必ず この本を読むべきです。

VUIの難しさ

普段、僕たちはスマホやPCのアプリやブラウザの画面をぽちぽちして、便利な生活を送っています。そこには素敵なデザインがあり、ユーザが使いやすいように工夫を凝らしたいろいろがたくさん詰まっています。これは、長年にわたしGUI(Graphical User Interface)やUX(User Experience) を、人類が研究してきた成果です。

ではVUIはどうか。

僕たちは、言葉を使い、会話を、普段からしているからVUIなんて楽勝じゃないか、と思うかもしれません。でも、人間は自分たちが思っているよりも相当にバカです。前述したように、自由にしていいと言われると何をしていいかわからない問題があります。

たとえば、レストラン検索スキルを想像してみてください。

人間:「新宿のラーメン屋を教えて」

レストラン検索スキル:「50件の新宿のラーメン屋が見つかりました。新宿1丁目x-x らーめんほげほげ、新宿三丁目x-xらーめんもぐもぐ、新宿四丁目ほげもげ亭、新宿……(50件続く)」

人間:「……」

何がなんだかわかりません。このあと何をすればいいのかわかりません。そもそも覚えてられません。

VUIにはVUIの作法があり、「会話」というプロトコルを通してコンピュータと円滑に対話するためにGUI以上に、UXをデザインする必要があります。

例えば、人間は何を答えればいいか明確になるような質問をVUIではするようにしないといけない。とか。(はい/いいえで答えられる。数値を答えればいいことが明白。足りない部分を適切に聞き返す、など)

会話でやり取りするために、画面でみる以上に注意深く考え、テストし体験をデザインしていく必要があります。

また、画面付きのスマートスピーカーで、どのように画面を利用するか、画面には人間のアバターを出すべきか、幾何学的なものを出すべきか。それぞれのときに何を注意するべきかなど、音声で操作する場合特有の、画面に何を表示するべきかという、GUIとはまた違った課題があります。

この本に書いてあること

思っていた以上にVUIは厄介です。考えること、知らないことがいっぱいあります。

この本では、こういったVUIのシステムを作る上で考慮すべきことが全て書かれています。逆にいうと VUIアプリ、システムを作る者は必ずこの本を読め ということです。

全てのVUIシステムの企画者、開発者が最低限しっておくべきことがこの本には書いてあります。このレベルの知識がない場合、ほんとうに議論になりません。

この本は大きく8つの章からできています

  • 1章 イントロダクション
  • 2章 VUIデザイン原理の基本
  • 3章 ペルソナとビジュアルVUI
  • 4章 音声認識技術
  • 6章 VUIのユーザーテスト
  • 7章 VUI 完成後にすべきこと
  • 8章 音声対応デバイスと自動車

4章だけは、音声認識技術それ自体に関する話なので、多くの人にとってはあまり重要ではないかもしれませんが、その他の章は必ず知っておくべき内容しかないです。

もしお近くで「Alexaスキル作りたいんですけど……」とか「Google Home対応したいんですけど……」とか言ってくる人がいたら「デザイニング・ボイスユーザインターフェース読みました?」と聞いてください。読んでないと言ってきたら、読んでくるまで相手にしてはいけません。この本に書いてあることが議論のベースラインになるからです。

先日テレビをみていて、どこかのホテルが客室にEchoSpotを置いてコンシェルジュ代わりにしている〜〜みたいなニュースをみました。少しだけそのスキルの紹介があったのですが、もう、これが ひどいUX でした。明らかにこの本を読んでいないし、VUIのUXについて全くきちんと考えられていない。

会話という、普段から僕たちが使っているプロトコルだからこそ、使いづらいときのストレスは異常に高いです。一方、きちんとデザインされ、熟慮され、洗練されたスキルは使っていて本当に便利だし、気持ちがいい。

少し考慮するだけで、VUIのUXは全然変わってきます。この 少し というのが、この本に書いてある内容です。

本は250ページくらい。平易な文章で誰もがわかりやすい内容です。図も多く、サクサク読めます。難しい理論は何もありません。当たり前だけど、知らないと気づかないようなことが書いてあります。

開発前にこれを読むだけで、使いやすさが段違いとなるので、VUIに関わっている皆さん、絶対に読みましょう。これは名著です。