ミニ特集「情報学と自然言語処理」:対話システム研究のこれから
はじめに
スマートフォン上の音声インタフェースやAIスピーカー,ペッパーなどのコミュニケーションロボットなどが身の周りに出現してきています.これらのシステムは言葉でやり取りが可能です.そのようなシステムのことを対話システムと呼びます [8].対話システムは1960年ごろから研究開発が進められていますが,主に音声認識技術の進展とともに,実用化され始めたのは最近のことです.近年,インターネット上の大量のデータ,大規模な計算機リソース,そして,ディープラーニングなどのアルゴリズムの進展により,対話システムの性能はさらに急速な進化を遂げています.最近の進展については,オープンキャンパスでの模擬授業 [1] でもお話しましたので,ぜひそちらもご覧ください.
対話システムは,チケット予約を行うシステムのように言葉でタスクを遂行するタスク指向型対話システムとおしゃべり,いわゆる雑談を行う非タスク指向型対話システム(雑談対話システムとも呼ばれます)に分かれます.
タスク指向型対話システムが進展することで,言葉だけで高度な人工知能を操れるようになります.もちろん,現状では天気を聞いたり,音楽をかけたりといった簡単なことしかできません.しかし,将来的には,地球環境のシミュレーションを行ったり,都市計画をデザインするといったことを,コンピュータを知的な相棒として,話しながら実現できるようになるでしょう.現に,現在,画像処理ソフトを音声で操作するといった研究が活発に進められています.複雑なことを,訓練なく簡単な言葉で実現できることは対話システムの大きな利点です.
雑談対話システムが進展することで,人工知能はタスクを遂行するだけでなく,人間と社会的関係を築くことができるようになります.人間同士の会話の60%は雑談であるとの調査結果もあり [6],人間は雑談が大好きです.人間は雑談を通して相手のことを知ったり,仲良くなったりするのです.人間は相手がコンピュータシステムであっても,あたかもそれが人間であるかのように扱ってしまうことが知られています.この特性により,相手が対話システムであっても雑談をしてしまいます.雑談によって人間と社会関係を築くことで,人間により信頼してもらえる対話システムの実現につながります.
タスク指向型対話システムと雑談対話システムは将来的には統合され,知的で信頼されるシステムとして,社会の一員になると考えています.ただ,そうした未来はまだもう少し先の未来かもしれません.我々、名古屋大学大学院情報学研究科東中研究室は,そうした未来を実現するための,さまざまな対話システムの要素技術に取り組んでいます.
研究室での取り組み
本研究室では,ユーザや状況に適応する対話システム,対話システムの応用,対話システムにおける共通基盤について取り組んでいます.
ユーザや状況に適応する対話システム
現在のシステムはまだ理想からはほど遠い状況です.チケット予約などの簡単なタスクであっても,全員がタスクを達成できるとは限りません.むしろ,達成できないケースの方が多いです.たとえば,対話ロボットを用いたフィールドトライアルでは,簡単な情報案内のタスクだったのにもかかわらず,約20%の対話しか成功しませんでした [5].残りの80%は,音声認識や発話のタイミング,対話知識の不備によって,失敗してしまいました.これは,システムがユーザや状況に合わせて動作できていないからです.
対話システムは一般に複数のモジュールを組み合わせることで実現されます.例えば,音声認識,言語理解,対話管理,発話生成,音声合成といったモジュールが組み合わされます.しかし,これらのモジュールは個別に開発され,疎結合されることがほとんどです.そのため,モジュール同士の連携が行われることは少なく,ユーザや状況に合わせて柔軟にその動作や連携の仕方を変えることができません.
本研究室では,モジュール連動に基づく対話システム基盤技術に取り組んでいます.この研究では,対話システムを構成するモジュールが,ユーザや対話状況に応じて,動作や連携の仕方を適応的に変えていきます.例えば,対話相手の表情や話し方,これまでに話してきた内容などから,語彙や声の大きさを変えたり,理解の仕方を変えたり,対話戦略を変えたりします.これにより,タスク達成を最適化し,誰にでもタスクが対話によって達成できるようにすることを目指しています.
対話システム応用
対話システムは世の中の様々なところで役に立ちます.特に,対話システムにとって,ヘルスケアや教育は有力な適用先だと考えており,これらの領域でのアプリケーションを構築することによって,社会に貢献したいと考えています.
本研究室では,高齢者を対象とした,認知症診断に向けた対話システムに取り組んでいます.認知症は,医療機関で診断されることが一般的ですが,日常会話の中で,いち早くその兆候に気付くことができれば有用だと考えられます.そこで,雑談の中で認知機能の低下を判断できる対話システムに取り組んでいます.また,会話を通して認知機能を改善することを目的とした対話システムにも取り組んでいます.
教育も対話システムの重要な応用先です.なぜなら,学習の進捗は人によって異なるため,インタラクティブにやり取りをしながら進めていく必要があるからです.教育向けの対話システムは,学習者が分かるまでやり取りをすることができます.既存の教育コンテンツからの対話システムの自動構築や,学習者の質問に自動的に答えることのできる教育用アバターの研究を始めています.
対話システムにおける共通基盤
人間と対話システムが共同作業を実現する方法を研究しています.特に,そのために必要な共通基盤の研究 を進めています.
共通基盤とは,話者同士が「ここまではお互い理解しているよね」と思っている内容のことです.共通理解や相互信念とも呼ばれます.現在の対話システムは,タスク指向型であれ,非タスク指向型であれ,複雑なやり取りはできません.音楽をかけたり,天気は聞けても,お店の窓口での相談やコールセンターのオペレータと行う込み入った内容は扱えません.おしゃべりをしても,同じ話題でなんとか会話は継続できるものの,少し複雑な内容となると,かみ合わなくなってしまいます.複雑なやり取りを行うためには,お互いの理解,すなわち共通基盤,を積み上げながら話を進めていく必要があります.本研究室では,共通基盤の実現に向けて,人間同士の対話・共同作業の分析やデータに基づいたモデル化を行っています.
対話システムのコンペティション
私が共同研究者と企画・運営している対話システムのコンペティションについても紹介しておきます.対話システムのコンペティションは,最新技術が競われる場所であるとともに,対話システムのコミュニティが問題意識を共有する場として有意義なものです.本研究室では,コンペティションの運営・参加により,対話システム研究の活性化に貢献しています.直近では以下のコンペティションに関わっています.
対話システムライブコンペティション
対話システムライブコンペティションとは,国内の対話研究者が一同に会する,対話システムシンポジウムにおいて開催されている対話システムのコンペティション [7, 3] です.オープントラックとシチュエーショントラックの2つの部門があり,オープントラックは,対話システムの任意の話題で雑談を行う能力を競うものです.シチュエーショントラックは,人間らしいシチュエーションに沿った対話システムの実現を目指すものです.昨年開催された対話システムライブコンペティション3では,シチュエーションとして,ユーザからの依頼をうまく断るという能力が競われました.これまでの対話システムは,こうした人間の機微を扱う社会的なやり取りはあまり取り組まれてきていませんでしたが,このような能力は今後人間社会の一員となる対話システムにとっては重要なものだと考えています.
対話ロボットコンペティション
対話ロボットコンペティションとは,タスク指向型対話を行うロボット対話システムのコンペティション[4] です.私がメンバーとなっている新学術領域研究「人間機械共生社会を目指した対話知能システム学」[2] の一環として実施しているものです.
本コンペティションでは,ホスピタリティがあり,かつ,タスク達成を適切に行うことのできるロボット対話システムの実現を目的とします.特に,旅行代理店課題に着目し,ユーザに観光スポットをお勧めするというタスクを取り上げ,言語処理や音響・音声処理だけでなく,身振り手振りなどのロボットならではのモダリティを組み合わせることで,対話システムが適切にタスク達成を行うための方法論の発見・共有を目的としています.実際の商用施設(大阪のEXPOCITYのららぽーと)にアンドロイドロボットを設置して予選会を行う予定です.
おわりに
対話システム研究は確実に進展しています.また,その処理は言語処理だけにとどまらず,音響・音声処理,ロボティクスに広がっています.また,適用先も,教育・社会学などへ広がりを見せています.様々な分野の研究者と連携しながら,社会の一員となれるような対話システムを実現していきます.
東中 竜一郎(知能システム学専攻)
参考文献
[1] ここまで来た!人工知能との会話(2020オープンキャンパス用ミニ講義). https://www.youtube.com/watch?v=mS7gGj36zhU.
[2] 人間機械共生社会を目指した対話知能システム学 — 文部科学省科学研究費助成事業「新学術領域研究(研究領域提案型)」. https://www.commu-ai.org/.
[3] 対話システムライブコンペティション3. https://dialog-system-live-competition.github.io/ dslc3/index.html.
[4] 対話ロボットコンペ. https://sites.google.com/view/crobotcompetition/home.
[5] Higashinaka Ryuichiro, Ishii Ryo, Matsumura Narimune, and Inagawa Ryuichi. Speech and language resources for the development of dialogue systems and problems arising from their deployment.
Proceedings of the LREC 2018 Special Speech Sessions, pp. 40–46, 2018.
[6] 小磯花絵, 石本祐一, 菊池英明, 坊農真弓, 坂井田瑠衣, 渡部涼子, 田中弥生, 伝康晴ほか. 大規模日常会話コーパスの構築に向けた取り組み―会話収録法を中心に―. SIG-SLUD, Vol. 5, No. 01, pp. 37–42, 2015.
[7] 東中竜一郎, 船越孝太郎, 高橋哲朗, 稲葉通将, 角森唯子, 赤間怜奈, 宇佐美まゆみ, 川端良子, 水上雅博, 小室允人ほか. 対話システムライブコンペティション3. SIG-SLUD, Vol. 5, No. 02, pp. 96–103, 2020.
[8] 東中竜一郎, 稲葉通将, 水上雅博. Pythonでつくる対話システム. オーム社, 2020.