音声認識で世界トップレベルの中国アイフライテック社の実力とは

同じ時代に強い者が複数人現れると、イニシャルをつけて呼ばれる。例えば王貞治さんと長嶋茂雄さんが活躍したときはONと呼ばれた。最近では、世界のITとEC(電子商取引)を牛耳る4社をFAGAと呼ぶ。フェイスブック、アマゾン、グーグル、アップルのことだ。

そして世界のAI(人工知能)市場を牽引する中国では、BATが並ぶ。バイドゥ(百度)、アリババ(阿里巴巴集団)、テンセント(騰訊)だ。

そして2017年、このBATにIが加わった。Iとはアイフライテック(iFlytek、科大訊飛)である。日本の科学技術庁や経済産業省と似た行政機関である中国科学技術部が同年に、第1次世代AIプラットフォーム発展計画を定め、その中で4分野を重点的に育成することにした。

さらにその4分野を引っ張る企業を1社ずつ任命し、その4社こそBATとI(アイフライテック)だったわけである。

今回は、中国AI界に現れた彗星、アイフライテックの実態に迫りたい。

続きを読む

アイフライテックは何をしている会社なのか

アイフライテックを知っている日本人はそれほど多くないだろう。そこでまずは、アイフライテックは何をしている会社なのかを紹介する。アイフライテックの「すごさ」は後で詳しく解説するので、本章では「大体このような会社」ということをつかんでいただきたい。

AI分野は拡大し、1つひとつの技術が専門分化しつつある。その中でアイフライテックが担うAI技術は、音声認識である。

音声認識とは、人がスマホに声をかけるとスマホが応答する仕組みの重要な技術である。iPhoneのシリ(Siri)が有名だろう。

コンピュータには「聴力」がないので、音声認識技術が搭載されていないコンピュータに人が声で話しかけても理解できない。

しかし音声認識技術を搭載すれば、人の声を波形としてとらえそれを文章に変換することができる。文章になれば、コンピュータに搭載されているAIが単語や文脈などから情報を拾って、意味を把握できる。AIが話者(人)の意図を推測できれば、AIは情報を集めて回答をつくることができる。その回答はまだ文章なので、音声認識技術は今度は「文章→波形→音声」という順番で音声をつくり、話者に語りかけるのである。

アイフライテックの音声認識の正答率は、6年前は6割程度にすぎなかった。それが現在は95%に達している。アイフライテックの音声認識技術のデモンストレーションはすさまじく、中国人がマイクに向かって中国語を話すと、モニター上に次々その言葉通りの中国語が書かれていく。しかも、ほぼ同時に英訳分も書かれていくのである。

アイフライテックの技術はすでに実用化されていて、実に12億台のデバイスにアイフライテックの音声認識が搭載されている。それらのデバイスは自動車製造、医療、金融、教育の各分野で使われている。

AI(人工知能)大国の中国に新勢力が登場した。アイフライテック(科大訊飛、iFLYTEK)だ。先行する3大AI企業のBAT(バオドゥ、アリババ、テンセント)を猛追している。アイフライテックは音声認識と、認識した音声を文章にする技術に強みがあり、これに自動翻訳の機...
今中国で最も注目を集めるAI企業のアイフライテック - 中国トップ3に猛追 - NISSEN DIGITAL HUB

アイフライテックの会社概要

アイフライテックは中国の安徽省に本社を構える。設立は1999年で、創業者で現CEOは劉慶峰氏。

中国のITやAIといえば、深圳市や広州市や北京、上海が日本人に知られているが、安徽省はあまり聞かない。しかしこの安徽省にアイフライテックがあることが同社のパワーの源泉になっている。

同省には中国の名門理系大学、中国科学技術大学があるのだ。劉慶峰氏は同大学で博士号を取得している。つまりアイフライテックは、大学発ベンチャーの先駆けのような会社なのである。

アイフライテックが安徽省にとどまる目的はまだある。それは人材の確保だ。同省は中国科学技術大学から優秀な人材を集めている。アイフライテックは中国政府や研究機関に太いパイプがあるので、優秀な学生や若い技術者も安心して同社に入社できるというわけだ。

アイフライテックの最大の強みは劉慶峰CEOの先見性かもしれない。同氏は創業当時から「AIは将来、生活インフラになる」と予言していた。まだ21世紀になっていない段階でAIの普及を予測していたのは鉄腕アトムの手塚治虫と劉慶峰氏ぐらいではないだろうか。もちろんアイフライテックの創業年1999年のはるか前からAI研究は世界中で行われていた。しかし生活インフラになるとまで予想した人はそうは多くはなかったはずだ。

アイフライテックは2008年に中国で上場している。現行の時価総額は1兆4,000億円ほど。

日本の金融界の王者である株式会社三菱UFJフィナンシャル・グループの時価総額が約10兆円だから、その10分の1の規模にまで迫っているのだ。

さらに、同社は売上高の20%を研究開発費に回している。成長性も十分期待できる。

アイフライテックの音声認識の実力

さて、話を中国政府のAI戦略と中国AI四天王BATIに戻そう。

中国科学技術部が打ち出した第1世代人工知能プラットフォーム発展計画は4分野に分かれていて、それぞれの分野に「リーダー企業」を定めて牽引させる、というところまで説明した。

Bのバイドゥは自動運転車分野を、Aのアリババはスマートシティ分野を、Tのテンセントは医療分野を担う。Iのアイフライテックは音声認識分野を担当する。

BATI4社の中では最も知名度が低いアイフライテックだが、その実力はすさまじい。

スマート企業で世界6位、中国勢で最高位

例えば2017年に米マサチューセッツ工科大学(MIT)が公表したグローバルスマート企業ベスト50に、アイフライテックは6位にランクインした。中国勢ではトップである。つまりMITは、スマート分野ではBATIの中でIが最も優れていると判断したのである。テンセントは8位に沈んだ。

ちなみに1位はAIの世界王者、米エヌビディア、2位はロケット開発の米スペースX、3位は世界ネット通販最大手アマゾンである。残念ながら日本企業は1社も入っていない。

医師試験を優秀な成績でクリア

アイフライテックの偉業はまだある。

音声認識技術では、音声を正確にとらえるだけでも高度な技術を要するのだが、アイフライテックは音声を読解する力も優れている。

音声認識技術と音声読解認識技術は、似ているようで異なる。例えば小学校教師が児童たちに四則演算の説明を場合は、子供たちは音声認識と音声読解認識の両方を同時に行うことができる。

しかし小学生に微分積分の解説をすると、子供たちは音声認識はできるが音声読解認識はできない。「何か数学っぽいことを言っているのはわかる」のが音声認識で、「だけど言っている意味が全然わからない」は音声読解認識の話である。

同じことがAIでもいえる。

音声認識を発達させたAIは、人との日常会話はできるようになる。簡単だからだ。しかし政治や経済などの専門的な話をAIと議論しようとしても、現代のAIはすぐに会話できなくなる。iPhoneのシリ(Siri)と深い会話をしようとして、シリが答えを濁すことがあるが、それは音声読解認識の能力が未熟だからだ。

ところがアイフライテックのAIはレベルが違う。2017年に中国の医師国家試験の筆記試験問題に、ロボットが初めて合格した。そのロボットの読解認識技術を担ったのが、アイフライテックである。

しかも単に合格したのではない。600満点中360点が合格ラインの試験なのだが、そのロボットは456点をマークし、トップ100に入ったのだ。つまりその年の優秀な新人医師の中にロボットが入ったのである。

マークシート試験であれば、正しい内容と間違った内容を見分けることが得意なコンピュータは強い。しかし今回は「考える」ことが必要な筆記試験で好成績を収めた。アイフライテックの技術は「人間に近付いた」だけでなく「秀才に近付いた」のである。

サムスンよりフェイスブックよりすごい

アイフライテックの偉業はまだある。

米スタンフォード大学は、AIの英語の文章の認識力と理解力を試すSQuAD(スタンフォードQ&Aデータセット)という技術競争イベントを行っている。例えば英文のウィキペディアの文章をAIがどれだけ正しく認識し、その意味を把握できているかを判定する。

アイフライテックはこのSQuADで2位になった。マイクロソフトが同着2位で、1位はグーグルだった。アリババは3位だったので、ここでもアイフライテックは中国勢1位を獲得した。

その他の著名な企業では、韓国サムスンが15位、米フェイスブックが31位、米IBMが44位となっている。アイフライテックは並み居る世界の強豪を抑えて2位を獲得したのである。

Facebook AI Researchが開発したfastTextは自然言語処理を高速、高精度化するために有効な機械学習ライブラリである。本記事では、fastTextの仕組みと、活用した場合に広がる可能性について述べる。fastTextで何ができるようになるのかfastTextはFacebook AI Researc...
Facebookが開発したfastTextとは?その活用事例を解説 - NISSEN DIGITAL HUB

まとめ~どこまでも拡大することができる

音声認識技術に強みをもつアイフライテックの事業領域は、どこまでも拡大することができる。なぜなら、パソコンのキーボードや文字入力が、コンピュータ難民を生んでいるからだ。音声認識技術はそのコンピュータ障害を解消する。

人が自分の言葉と声でコンピュータに指示したり質問したりできれば、パソコンの外形はまったく違ったものになるだろう。パソコンが要らなくなるどころか、スマホでもタブレットでもない新しいデバイスが現れるに違いない。

しかもアイフライテックはAIを賢くさせることにも取り組んでいる。AIが賢くなれば、一般の人には理解が難しい分野のサービス提供が容易になる。例えば医療だ。

一般の人は、自分の体に異常が起きても、どの薬を使ったらいいのかも、体のどこを切ったらいいのかもわからない。医者だけが頼りだ。しかし医者並みに賢いAIが家庭に配置されれば、医者にかかる前にAIに相談すれば多くの悩みが解決するようになる。

そして賢さが必要な分野の筆頭といえば教育だ。教師は賢いから「先生」と呼ばれる。しかしこの分野もAIが力を発揮するだろう。覚えることが得意なコンピュータがいま、読解力まで身につけようとしているのだから、そのうち「教える」力でも人間の先生を追い越すだろう。

アイフライテックはいますでに、医療にも教育にも手を伸ばしているのである。

スマートフォンに話しかけるだけで相手に電話がつながったり、原稿を音声入力で書けたり、簡単に議事録の文字化ができたり、と音声認識技術は急速に普及している。何を隠そう、この記事も一部は音声入力で書いたものだ。マルチマイク搭載の広がりで進化する音声認識...
AIで広がる音声認識技術の未来 - NISSEN DIGITAL HUB


<参考>

  1. 中国科学技術部が次世代4大人工知能プラットフォーム発展計画を策定、その一翼を担うアイフライテック(科大訊飛/iFLYTEK)とは!(Glo Tech Trends)
    https://glotechtrends.com/iflytek-china-ai-4-platform-171221/
  2. MITが選ぶ「2017年 世界で最もスマートな企業50」前編:1位~25位(NEWS PICS)https://newspicks.com/news/2450307/body/
  3. 日本企業がMITのスマート・カンパニーにランクインしなかった理由(MIT Technology Review)
    https://www.technologyreview.jp/s/46089/it-pays-to-be-smart/
  4. SQuAD(Stanford University)
    https://rajpurkar.github.io/SQuAD-explorer/
  5. 中国の3大「AIテクノロジー」企業、1400億円市場を狙う各社の戦略(Forbes)https://forbesjapan.com/articles/detail/15922/2/1/1

シェア

役にたったらいいね!
してください