アイキャッチ

「世界最先端のAI音声関連技術で人々の暮らしを豊かに」

公開


【大浦 圭一郎 氏 略歴】
生年月日:1982年2月28日 出身高校:名古屋西高校
名古屋工業大学に入学後、徳田恵一教授に師事して音声認識および音声合成の研究に携わる。音声合成システムの基盤ソフトウェアである『HTS』をはじめ、複数のソフトウェア開発で中心メンバーの一人として活躍。名古屋工業大学大学院博士後期課程在学中の2009年11月に当社創業。2017年度より同大学院の特任准教授に就任。

【株式会社テクノスピーチ】
設 立 :2009年11月19日
資本金 :33,000千円
所在地 :愛知県名古屋市千種区千種2-22-8 名古屋医工連携インキュベータ
事業内容:音声/歌声合成技術の研究開発およびライセンス事業

<起業家インタビュー>

世界最先端のAI音声関連技術で人々の暮らしを豊かに


-2019年度インデペンデンツクラブ大賞グランプリの受賞おめでとうございます。歌声合成デモの精度に驚いた方も多かったようです。

ありがとうございます。音声合成・歌声合成の技術力には自信を持っていますが、事業の将来性を評価いただいた事を嬉しく思います。何より、こういった表彰は従業員の励みになります。グランプリの名に恥じぬよう、チーム一丸で世界に飛躍していかねばと身が引き締まる思いです。

-音声合成分野の世界的権威である名古屋工業大学徳田恵一教授の研究室出身です。

当社の基礎となる技術は徳田が1990年代後半から研究してきたものです。統計モデルを用いた音声合成手法は当時マイナーでしたが、2005年頃に国際的なコンテストで1位を獲得してから次第に認知されるようになり、グローバル企業との共同研究オファーが増えました。今年4月、徳田はこれらの業績が評価され紫綬褒章を受章しています。

-これまでの音声合成技術との違いは何でしょうか。

従来の波形接続型音声合成手法ではなく、最新の統計的パラメトリック音声合成手法を用いているため、「怒った声」「悲しい声」など、多様な発話スタイルの自然な音声や、歌唱者の癖・テクニック・裏声を再現した自然な歌声を合成することができます。テクニカルな面においても、高速・軽量に稼働するようシステム設計がされており、テキストが入力されてから音声が合成されるまでの遅延がほとんどなく、高性能なコンピュータでなくても利用いただけます。

-2018年の技術革新が大きな転機になりました。

深層学習等のAI技術を適用して歌唱者の声質・癖・歌い方を学習することにより、限りなく人間らしい音声・歌声を実現することに成功しました。超高品質な音声・歌声を、ベタ打ちのテキストや楽譜を入力するだけで合成できる容易さも特長です。これにより、従前は「いかにも合成らしい音声・歌声」が課題で利用を躊躇されてきた分野からも引き合いが殺到しています。

-エンタメ以外ではどういった分野での利用が想定されますか。

例えば教育分野。新型コロナウイルス感染拡大防止対策として行われるオンライン授業のコンテンツ作成のため、全国の学校に音声創作ソフトウェアの無償提供を行いましたが、大変好評をいただいています。医療分野では、声帯を失ってしまった方の声を再現するということも可能です。まだまだ音声インターフェース市場は飽和しておらず、あらゆる分野・利用シーンで活用できるので、ユーザーベースや事業基盤を持つ企業と組みながらアプリケーション開発を進めていきたいと思います。

-創業11年目にして初めて外部資本を調達しました。

今年5月に地元のベンチャーキャピタル2社より出資をいただき、別の投資家との交渉も最終局面にあります。起業当初は小さくても確実に利益を出して、ゆっくり成長していけば良いと考えていました。ターニングポイントだったのは、2018 年の技術革新です。殺到した問合せの対応に追われ、中には興味深い商談もたくさんあったのですが、社内リソース不足でお断りせざるを得ないケースが多発してしまいました。世の中からの要請に対し、いつまでもマイペースでいることはできない。とにかく人材を充実させて会社を大きくする責任がある。経営者として覚悟が決まった瞬間だったのかもしれません。

-大浦さんの起業家としてのモチベーションはどこにあるのでしょうか。

元々はロボット、特にドラえもんのような自我を持ったロボットが好きで工学部を専攻しました。音声合成の道に進んだのは、それがどういう仕組みになっているのか見当がつかず、とにかく不思議で知的探求心を刺激されたからです。そして実際に音声合成は非常に興味深く、すぐにのめり込みました。今でも開発は好きです。しかし、成果物に対する世間の反応を見て喜んでいる従業員を見て、「ああ、自分はこれを一番求めているのだ」と気が付きました。そのためには社会的インパクトのある成果物を作る必要がある。そして人を集め活躍してもらう場を創らなくてはならない。そう考えたのもアクセルを踏むに至った理由のひとつです。

-今後の展望についてお聞かせください。

これまでの技術供与モデルからシフトし、AI技術を用いた業務用総合音声制作プラットフォームとして大きくスケールしていく計画です。3DCGや映像、音楽には法人向け制作ツールがありながら、音声や歌声の領域にはこれまで存在しませんでした。ビジネスモデルとしては、2種類のサブスクリプションプランを準備しており、利用企業と音声の著作者の双方にとって利益のあるモデルを構築していきます。当然海外展開も視野に入れています。現在は日本語・英語・中国語・仏語に対応していますが、利用企業の要望に応じて増やしていき、また海外のパートナー企業と組むことで現地対応やサービス展開をしていければと考えています。
 会社のビジョンを立てることに未だ慣れないのですが、「世界最先端のAI音声関連技術で人々の暮らしを豊かに」という表現がテクノスピーチらしいと思っています。人と区別できない音声合成・歌声合成技術を取り扱うので、企業倫理も重要です。我々の技術が世の中の当たり前として存在できるよう、今後も事業により一層邁進していきます。

(2020.7.3 interviewed by 國本行彦)

※2020年8月号掲載時点での情報です


株式会社テクノスピーチ

住所
愛知県名古屋市東区葵1-14-13アーク新栄ビルディング5階C号室
代表者
代表取締役 大浦圭一郎
設立
2009年11月19日
資本金
3,000千円
従業員数
12名
事業内容
音声/歌声合成技術の研究開発およびライセンス事業
URL