人工知能Siriの仕組みと歴史

ipadやiphoneを持っている人はSiriを知っているだろう。音声でアプリを立ち上げたり、時間を測ったりすることが可能だ。しかし、このSiriについて詳しく知っている人は少ないのではないだろうか。このコラムではSiriの歴史や仕組み、今後の展開について説明したい。このコラムを読めば、Siriのすべてがわかるだろう。

続きを読む

Siriとは

そもそもSiriとはアップル社の開発した音声認識機能である。英語は「Speech Interpretation and Recognition Interface」と書き、その頭文字を取ってSiriなのだ。タイマーを使う時にこれまではタイマーのアプリと立ち上げて行っていたのでが、「Hey,Siri。3分測って」と言うと3分のタイマーがスタートする。また他の家電と接続することで、温度調整をiphoneで行うことも可能だ。あなたの好みを学習して、よりあなたの望んでいる音楽を流すこともできる。こうした機能は「google home」など他社でも発売されているが、iphoneやipadに搭載されているSiriの方が身近な人が多いだろう。

先日の検索サイト大手であり、デジタルジャイアンツの一角であるGoogleによる「Google I/O 2018」の中で、AIに関する驚異的なデモが行われたのをご存じだろうか。音声アシスタントと言い、一種のチャットボットなのだが、スピーカーからは、すでにチャットボットの域...
Google音声アシスタントがひらく、新たなビジネスの可能性とは?(Google I/O 2018... - NISSEN DIGITAL HUB

Siriがどのように成長を遂げてきたのか(歴史)

人工知能という言葉は1956年のダートマス会議で初めて使われ、そこから人工知能の開発が始まった。人工知能とは何かという定義に関してはさまざまあるが、人間と同じような知能をコンピュータで実現させるという試みである。知能とは何かとなるとまた複雑になるので、それ以上は踏み込まない。

そうした流れの中でSiriは開発されているが、Siriの前進は1964年に開発された対話システムの「ELIZA(イライザ)」である。Siriに直接聞いてみても、イライザが私の先生だと答えてくれる。このころ人工知能の開発がさかんに行われており、イライザもそうした中で登場した。イライザの仕組みは決まった入力に対して、決まった返答をするだけであったので、人工知能というよりも「人工無能」などとも呼ばれていた。

しかし、当時は機械とやり取りするという意味で画期的であった。しかし、コンピュータの能力の限界と決まったやり取りしかできないということで、イライザに対する期待はしぼんでいった。そこで、専門用語に絞った「エキスパート」が登場する。こちらは特定の専門用語に絞って教えてくれる機能を備えていたが、それでも当時のコンピュータの処理能力が低く、大きなブームになるということはなかった。そうした中、2000年代後半になるとSiriが登場する。

Siriアメリカ国防高等研究計画局が戦場で兵士をサポートするシステムとして開発が始まっており、その後、アップルに売却された。元々が国家プロジェクトであるため、多額の資金が投入されるほど注目されたものであった。そして、現在のような対話型のSiriが完成し、対話システムの代表となっている。ここまでの処理が数秒もかからずに行われているわけなので、技術の発展が目覚ましいということがわかる。

Siriの仕組み

Siriがどのように動いているのかの詳細は公表されているものではないが、機械学習と音声認識を使っているのは間違いない。音声認識したものをテキストデータにし、それを解釈して命令を送るのである。siriはNuance Communications社が持つ音声認識技術を使っていると言われている。音声認識には音響モデルと言語モデルがある。音響モデルとは音の波と文字を合わせたデータのことである。つまり、この波形なら「あ」で、この波形なら「い」というものである。このデータに基づき、入力された音声をテキストデータに置き換えていく。一方、言語モデルは単語のデータとその単語がどのように並ぶ可能性があるのかのデータを合わせたものである。言語モデルを使って、音声を正しい文に並び替えていく。siriに話しかけると音声が言葉に置き換えられているところが見えるが、それはこれらの技術を使っているのである。このようにテキストデータに置き換えた後は、その意味を解釈しなければならない。それができなければただの文字列になってしまう。この処理にニューラルネットワークや機械学習が使われており、より正確な理解をするために学習していくわけである。siriの場合、サーバーに蓄積されたデータを使っているので、サーバーに接続できない環境では使うことができない。また、検索しても出てこない 入力に対してはあらかじめ返答の言葉が用意されているという。このやり取りに関しては前述したイライザと変わらないということだ。

Siriの今後

Siriが登場した際には革新的な技術であり、iphoneがそうであったように他社製品を駆逐してくと考えられていた。しかし、実際にはアマゾンのAlexaとグーグルのグーグルアシスタントに水をあけられている。実際にアップルの元開発者は開発の遅れを指摘している。その理由としては情報を開示していないことがあげられる。アップルの場合、情報を開示していないので、Siriを使ったアプリの開発に制限がかかってしまう。これはアマゾンやグーグルと大きく違うところである。アマゾンやグーグルは第3者に情報を開示しているので、開発が進んでいくスピードが速い。アップルが大きな後れを取っている原因がこれである可能性は高い。今後もこうした制約は改善されることが無いと言われているので、他社よりも先に行く可能性は低い。そうした中でアップルは「HomePod」を発売したが、やはり評判が悪い。音声はいいがSiriの能力が低く使えないと言われている。今後、改善が進み、アップルやグーグルに勝つことができるのだろうか。その道のりは険しいと言わざるを得ないだろう。ただSiriを改善するために大量のエンジニアをアップルは雇ったようだ。今後の動きについても注目していくべきだろう。

まとめ

ここまでSiriの仕組みと今後について説明してきた。登場した時は驚きで迎えられた技術もアップルやグーグルに後れを取るようになっている。ただSiriのような対話型の人工知能の開発はますます進むようになってくるはずである。そうした中でSiriは生き残ることができるのか。今後の開発に注目していこう。

AIスピーカーとは、AI(人工知能)技術を搭載したスマート家電の一種である。スマート家電とは、インターネットにつないで利便性を高めた家電のことである。――と聞いても、AIスピーカーを知らない人は想像しにくいだろう。それは無理からぬことで、AIスピーカーが世...
AIスピーカーの仕組みとは?【徹底解説】 - NISSEN DIGITAL HUB


<参考>

  1. 一番身近な人工知能Siri。人と対話するまでの歴史やその仕組みを紹介(Ledge.ai)
    https://ledge.ai/siri_ai/
  2. Siriが話を聞いて答えたり、何かをやってくれるしくみ(プログラミング+)
    http://ascii.jp/elem/000/001/253/1253779/
  3. 「Siri」とは?意味や使い方を解説!(意味解説ノート)
    https://meaning.jp/posts/1443
  4. Siriについて(アップルホームページ)
    https://www.apple.com/jp/siri/
  5. 「Siri」と「AI」の関係を整理する(IT media)
    http://www.itmedia.co.jp/mobile/articles/1706/04/news012.html
  6. 対話システムを構成する2つの仕組みと、フレームワークとは?
    https://spjai.com/interactive-system/
  7. アップルの「Siri」は、なぜアマゾンやGoogleの人工知能に後れをとってしまったのか(WIRED)
    https://wired.jp/2017/10/25/siri-why-have-you-fallen/
  8. SiriはAmazonやGoogleに追いつく事もできない?元従業員が「Siriの開発事情」を暴露(カミアプ)
    https://www.appps.jp/266029/
  9. HomePodと暮らして6カ月、値段に見合う価値はありませんでした(GIZMODO)
    https://www.gizmodo.jp/2018/08/six-months-with-the-apple-homepod.html
  10. Apple、Siriをよりスマートにするためにエンジニアを大量採用中(ロボスタ)
    https://robotstart.info/2018/04/02/apple-hiring-siri.html

シェア

役にたったらいいね!
してください