遠くの相手と話が出来る「電話」。
みんな生まれた時から身近にあるので電話について深堀して考えないと思いますが、改めて考えてみると非常に便利ですよね?
最近はガラケーやスマホという携帯電話が普及し、どこでも誰とでも話が出来るようになりました。
スマホから聞こえる母親の声、友人の声、恋人の声・・・本人の声同士で通話しているかと思いきや、実は合成音声だったのです!
携帯電話での通話は本人の声ではない
携帯電話やスマホで通話の際に聞こえる声が、話し相手本人の声ではないということをアナタは知っていましたか?。
実はその声は、本人の声そっくりに合成された機械の音声なのです。
電話線につながっている固定電話では、声の波形がそのまま電気の波形に変換されて届きます。
人間の声そのものは非常にデータ量が大きく、無線で通信する携帯電話やスマホの回線では届けにくいのです。
そこで、データ量を減らすための技術が必要となります。
まずは人間の声を「音の情報」と「声の特徴」に分解します。
しかし、音の情報だけをデータ化して再現するとロボットのような電子音声になってしまいます。
そこで次に、話し手の声の特徴に似ている音源をコードブック(音の辞書)の中から探します。
コードブックには音の素となる組み合わせパターンが約13億収録されていまして、話し手の声に似たパターンを見つけたら音の情報と一緒に送信します。
すると受け手の端末では送信された情報をもとに音声が合成され、話し手そっくりの声が聞こえるようになります。
多くの人が合成音声とは気付かないほど、すごい技術なのです。
人間の声は、音源である声帯の音の特性や有声・無声の区別と、咽喉と口腔、鼻腔、舌、唇などの調音器官(声道)の共鳴による周波数選択特性でモデル化できる。音声波形はかなり早い振動成分を含むが、調音機構などの動きはそれと比べると比較的緩やかであり、それらを適切にパラメータ化することができれば、必要なデータを大幅に減らすことができる。
wikipediaより引用
隠れコラム「石原さとみのコードブック欲しい」
結論
スマホやガラケーでの通話はお互いに合成音声だった!