概要 アクセス タイムテーブル インタビュー 会場マップ 登壇者一覧 講演動画・スライド
チケット購入
unity
概要 アクセス タイムテーブル インタビュー 会場マップ 登壇者一覧 講演動画・スライド

Unite
Tokyo
2019

インタビュー

NTTドコモがUnityユーザーへ伝えたいこと

2019-09-12 update

秋永 和計

株式会社NTTドコモ 担当部長

株式会社NTTドコモのR&DでAI/機械学習やクラウドに関連するサービスやソリューションに関連する開発や開拓に従事し、現在はProject:SEBASTIEN(AIエージェントAPI)のプロジェクトリードやxR戦略などを担当。

尾崎 竜二

だるまジャパン合同会社 CEO/テクニカルディレクター

大手家電メーカーでシステムエンジニアを経験後、ITベンチャーにてフィーチャーフォンやICカードを用いた製品開発に従事。2011年に岐阜県のスマートフォンアプリ開発者人材育成事業に参加した後、そこで出会った仲間と2013年だるまジャパン合同会社を設立。現在は音声対話エンジンを用いたVRサービスなどの制作に携わっている。

北川 正義

だるまジャパン合同会社 テクニカルアーティスト

企画、演出、グラフィック担当。UnityやCGを使い様々なクリエイティブを行っている。最近はバーチャルの世界にハマっている。

音声認識と音声合成を活用できるドコモAIエージェントAPI

だるまジャパンの尾崎さんと北川さんはUnite Tokyo 2018 でも登壇されていましたが今回はどのようなお話になるのでしょうか。

はい、昨年は私と北川が『裸眼で拡張現実!!プロジェクションマッピングとAIで世界最先端研究を丸見えに』と題した講演をおこないました。

裸眼で拡張現実!!プロジェクションマッピングとAIで世界最先端研究を丸見えに

そのときに、冒頭で『ドコモAIエージェントAPI』を使ったコンテンツについて、「こういったものを作っています」というお話をしていましたが、今回の講演では、NTTドコモの秋永さんと、違うものについてお話をする予定です。

そもそも、NTTドコモとだるまジャパンが協業をするきっかけになったのはどういった経緯なのでしょうか。

昨年、NTTドコモが全国でAIエージェントAPIを広めるために、全国をまわって勉強会を開催していた時期がありました。そして昨年の2月に岐阜で勉強会を開いた際、だるまジャパンのお二方がそのイベントに来てくださって、「一緒にモノ作りをしたら面白いんじゃないか」、と感じたのがきっかけでした。 そこで、だるまジャパンのお二方が「Unityで作りたい」とお話を持ちかけてくれて、そこから一緒に制作を始めました。そのおかげで、Unityという世界とそのコミュニティを知ることができて、我々の枠が拡がった感じがしたと思いました。たしかに、Unity上で作られているモノに対しての親和性が高いなというイメージを持つようになったので。そういった経緯があって一緒に制作をしています。

ドコモAIエージェントAPI以外にも、Magic Leapについてもお話されるそうですが。

はい、NTTドコモとしては、Unityのコミュニティに属する方たちに対して、2つの訴求ポイントがあります。1つは、ドコモAIエージェントAPIについて。誰もが音声認識と音声合成を上手く活用したビジネスをできるように、我々がシステムを提供しています。特にUnity界隈の方々には、たとえばゲームとか、Unityを用いたVRとかで、「音声認識と音声合成を使って面白いことをやりたい」と考えている人たちにうまく使っていただきたいと考えています。その実例を、今回のUnite Tokyo 2019でお話ししようと思っています。 NTTドコモでのUnityを利用した開発の話はかなり先進的な取り組みなので、今回の展示は技術デモ的な形になると思います。Unity向けのSDKは今回のUniteのタイミングでベータ版の公開を予定しており、そのあたりのお話もさせていただく予定です。

日本語そのものに対する言語の解釈を行うAIエージェント

AIをサービスとして利用できるものは、すでに他社でもリリースが行われています。NTTドコモのAIエージェントはどのような形で利用されるイメージをお持ちなのでしょうか。

基本的には他社のAIと同じようにユーザーにご利用いただけるものですが、我々の場合は自分の考えるAIを自由に作成してもらえるようにAIエージェントのシステム部分をまるごとサービスとして提供しています。他社のものは自分で音声認識や音声合成、自然言語処理のAPIをハンドリングしなければいけないという印象が強いのですが、我々の場合は一体のシステムですべて提供しており、Unity側には、単純に「耳」と「口」という部分を提供しているということになりますので、非常に使いやすくなっていると思います。 それから、ロジックを組み込むといったところは、サーバー側で色々といじりやすくなっているため、作り方さえわかれば、面白い取り組みができると思います。 それから、日本企業の我々がAIエージェントを作成する、という強みで言いますと、もともと、日本語の音声認識、日本語の音声合成、そして日本語そのものに対する言語の解釈——それを我々は自然言語処理と呼んでいます——そういったものというのは、特にNTTドコモの場合では、2012年から『しゃべってコンシェル』というエージェントがあるのですが、それをベースに育ててきたものを今回バージョンアップしました。去年から『my daiz』という形でアプリを提供していますが、それとまったく同じシステムを皆さんにご利用いただけるというところが一番のポイントになっています。

今回の講演の対象者はどのような方になりますか?

音声認識・音声合成を使ったUI / UXというのはまだまだこれからだと思っています。ですから、まずはエンジニアの方々に色々と試していただきたくて。「こういう使い方ができそうだ」、「ああいう使い方ができそうだ」というのを、まずはそういうところでお試しいただきたいな、と。かつ、もし面白いものができあがった時には、ぜひそれをご採用いただければと思っています。 AIエージェントを使ったゲームはこういう世界観だ、と最初から言えればいいのですが、まだこれからだという気がしています。特にUI / UXの話で言うと、ちょっと前にスマートスピーカーが出てきたときに、「音声認識・音声合成ですべてが完結する世界観だ」と言ってはみたものの、不便な部分が当然出てきたわけです。また、「長く使われるためにはどうしたらいいんだろう」とか、いまだに議論になる部分もあります。それを解決する手段と言いますか、自分たちでハンドリングしやすい、自由度の高い音声認識・音声合成を提供できている、というのが我々の強みだと思います。

Uniteにいらっしゃる方々のスキルレベルを考慮した上で、ビギナーレベルでも十分理解できる内容になると思います。また、エンジニアでない方でもぜひお越しいただければと思います。僕自身エンジニアではなくアーティストなのですが、それでも作れるくらい簡単なので、大丈夫だと思います。プランナーの方がプロトタイプを用意したいという場合でもしっかりと作れる感じにはなっていますので。

AIエージェント「セバスちゃん」

今回は、だるまジャパンの「セバスちゃん」が登場するということですが、そちらはどのような形になるのでしょうか。

「ニコニコ超会議」に出ていたりだとか、NTTドコモのオープンハウスに出たりしていた「セバスちゃん」というキャラクターを使ったコンテンツの作り方をご紹介するつもりでして、「セバスちゃん」自体も登壇者として出そうと思っています。

こちらの「セバスちゃん」は、1年前に秋永さんが立ち上げた「SEBASTIEN」プロジェクトと関連しているのでしょうか?

もともと、「いわゆるAIエージェントというものを皆さんに簡単に使っていただくためにはどうしたらいいだろう」ということをプラットフォームのビジネスとして考え始めて、それをプロジェクト化したものが「SEBASTIEN」プロジェクトになります。このプロジェクトは2016年からスタートしていて、「どういうシステム構成にしたら皆さんにとって使いやすくなるだろうか」という議論を重ねて、2年後にようやく『my daiz』、そして今年の4月にドコモAIエージェントAPIという形で法人向けに出せるまでに至りました。 Unityについて色々とコンテンツを作る中で、「キャラクターがほしい」という意見が出ましたので、だるまジャパンさんに協力していただいて、「セバスちゃん」というバーチャルキャラクターを作ってもらったというわけです。こういった経緯になります。キャラクターの名前については、見ての通り「SEBASTIEN」プロジェクトから取っています。なので、ダジャレです(笑)。

現在、Unite Tokyo 2019で登壇可能かどうか技術的な検証を行っている段階です。

「セバスちゃん」を用いてサービスの実演をすることで、こういう使い方もできますよ、というのをお披露目するわけですね。

特にUnity関連で言うと、音声合成の幅が非常に豊富である点が当サービスの特徴になっています。わかりやすく言うと、キャラクタービジネスがすごくやりやすくなっているんです。有名な声優さんの音声モデルを作成すれば、音声合成機能を駆使して簡単に運用できますし、声の再現性についてもかなり高く作ってあるので、そういう意味ではゲームを作ったり、バーチャルキャラクターを作ったり、3Dを駆使して没入感を創出したり、といったUnityの世界観と非常に合っていると思っています。

単純に、AIエージェントAPIそのものについては、こんなに簡単な操作で音声認識させることができますよ、という軽いデモを入れるつもりです。

こちらのサービスが、Unityで使用できるようになる時期は決まっていますか?

Unite Tokyo 2019までには準備をする予定です。AIエージェントAPI自体はすでにどなたでも使っていただける状態にはなっていて、Android端末やiOS端末向けのSDKがもともとありまして、そのオーサリングツール上で作っていただけると簡単にDeployできる、といった仕組みになります。

Magic LeapとNTTドコモ

続いて、Magic Leapについてのお話をお伺いします。

NTTドコモはもともとガラケーを提供してきて、スマートフォンを提供してきました。「じゃあその後は何を提供するんだ」という段階、ポストスマートフォンといったものを考えた時に、いわゆる「AR」、「MR」といった分野で攻めることができるのではないかと考えました。そして今年の4月末に、Magic Leap社との資本・業務提携を発表させていただきました。 とはいえ、我々はARやMRといった領域において、ビジネスの面も含めてまだまだこれからといった感じです。これからそういった領域でコンテンツを作っていくことになりますし、この領域でどういったビジネスができるのだろう、といった部分を考えています。Magic Leapのデバイスを用いると、Unityの開発環境で簡単にMRのコンテンツを作ることが可能だと分かったので、弊社としても「コンテンツを作る」といったことに関して、Unityエンジニアの皆さんと協力していきたいと思っています。かつ、弊社のAIエージェントと組み合わせることで、さらに可能性が拡がっていくので、弊社としては色んなアセットを通じてシナジーを生んでいきたいと考えています。また、Unityというプラットフォーム上で表現するデバイスと、我々の持つアセットを活かせるというのは、すごく有機的じゃないですか。そういった有機的な結合を望める、良いプラットフォームだな、と弊社からは見えています。

Unityのコミュニティの中から、NTTドコモのパートナーを探していく、ということですね。

はい。残念ながら現在のMagic Leapの端末は2,200ドル(約233,500円)くらいする非常に高価なデバイスです。しかし、それを日本に持ってきた際にどういったことができるのかな、という話を内々でしています。たとえば、開発を希望するエンジニアさんに貸し出すとか、開発情報の提供とか。開発情報は今、英語のものがベースになっていて、日本で技適を取るのに時間がかかったこともあってコミュニティの盛り上がりはまだまだなんですよ。そこに対して、色々な情報を提供するなど、さまざまな取り組みをやっていきたいと考えています。まずはMRでビジネスができる態勢を作るというのが、大きな目標ですね。

AIエージェントAPIの勉強会を開催して日本全国をまわったというお話もあったように、Magic Leapに関しても同様な活動を行うということなのでしょうか?

はい。まずは開発者の方に使っていただけるようなプラットフォームやデバイス、そして開発環境をご用意しなければ、そもそも作るという選択肢がなくなるだろうと思っています。じゃあ、「使いやすいモノを作るためには何が必要なのか」ということに対して真摯に耳を傾けて、我々ができることをやっていきたいです。何よりも、Unityが取り扱っている領域というのは、日本の得意なIPに絡むものが多いという印象があります。たとえば、アニメだったり、ゲームだったり。そこに対して、新しい概念をできるだけ早く導入して、日本発のコンテンツをたくさん作っていきたいと考えています。

既に先行してさまざまなデバイスが出てきていますから、それに関する知見も日本のエンジニアの中にたまっています。

それもありますね。特に、最近はVRで色々と出てきていますが、MRに関して言うと、まだコンシューマービジネスの段階には行ってない、あくまでBtoBがメインです。NTTドコモって、本来はBtoCの会社なんですよ。要するに、生業はBtoCなんです。もちろんBtoBもやっていますが。BtoCに行くためには何をすべきなのか、というところには、多分一番興味があると思います。 それは、現在開発中の5G回線によって通信速度がさらに速くなったりだとか、技術が足りてない要素や、会社目線で見た時に使いにくかったりする要素とか、そういったところに、素早くフィードバックをもらいつつ、どんどん加速していきたい、という思いは強いですね。

MRの世界では、BtoBにフォーカスしているデバイスがありますが、Magic LeapとNTTドコモはBtoCを狙う、その理由はどこにあるのでしょうか。

BtoBを狙うことって、そこまで難しい話ではないと思うんです。結局のところ、特定の領域に対して特殊なモノを作ればいいだけなので。ただ、万人受けをするモノを作るというのは狙ってできるものじゃない。色んな人が色んなアイデアを出さなければ絶対に無理だと思うんですよ。色んな開発者の方々が試行錯誤して、色んなビジネスを試される中で生まれるものであって。そういったことをどんどんやっていきたいな、と。 NTTドコモとしても、Magic Leapのみにフォーカスしているというより、どちらかというとxRで「どういう時代が来るんだろう」と、楽しみに見ているのです。その中でNTTドコモができることと言えば、海外から色んなデバイスを持ってきたり、開発情報を出したり、サポートを提供したり。そういったところをやらせていただけたらなと思っています。

エンジニアは具体的にどんなアクションを起こせば良いのでしょうか?

そこに関しては、現時点だとまだ定まっていないですが、少なくとも開発者支援プログラムを作ろうと思っています。Unite Tokyo 2019の開催に合わせて発表できるかどうかも未定ですが、様々な支援プログラムを作る方向ではあります。さらに、皆様にxRの技術に触れてもらって楽しんでいただけるような場所を作ろうとも考えています。また、当日はブースを出展しますので、そこでぜひ具体的にお話させていただければと思います。

当日、ブースではどのような出展を予定されていますか?

「セバスちゃん」のVR握手会を予定しています。Magic Leapについては、だるまジャパンさんのように先行して触っていただいている開発者コミュニティの方々がいらっしゃるので、その方たちによって作られたコンテンツを体験していただく予定です。

日本国内の先行事例を体験していただく、ということですね。

そうですね。実際に自分も作ってみたいな、と感じていただけるような体験をお届けできればと思っています。当日、ブースにて我々スタッフが対応いたしますので、ご質問等あれば気軽にお声かけいただければと思います。

ドコモAIエージェントAPI ドキュメントサイト Magic Leap 公式サイト