耳で聞くようになると、テキスト読み上げに使われる声が気になる。
iPhone の声は「サマンサ」(Samantha)だそうだ。
デスクトップではいちばん自然に聞こえる「アレックス」(Alex)の声が気に入っていた。
アレックスの声の自然さについては、アップル自身が解説を加えている。
Accessibility – OS X – Vision | Apple
アクセシビリティ – OS X – 視覚に障がいのある方に | アップル
* * *
アレックスの声(The Alex Voice)
Macの声、Alexをご紹介しましょう。Alexは、先進的なAppleのテクノロジーを使って、たとえ非常に速い話し方でも英語の自然なイントネーションを再現します。ほとんどのTTS(テキスト読み上げ)システムがテキストを一文ずつ分析して合成するのに対し、OS Xは段落ごとにテキストを分析。その内容をより正確に解読します。さらにAlexは人間の話し言葉のニュアンスをより詳細に反映させるので、本、記事、ニュースなどの長い文章の意味が、より理解しやすくなります。長い文章を読み上げる時は途中でひと呼吸おくので、Alexはとても自然です。
Introducing Alex, the voice of the Mac. Alex uses advanced Apple technologies to deliver natural intonation in English even at extraordinarily fast speaking rates. While most text-to-speech (TTS) systems analyze and synthesize text one sentence at a time, OS X analyzes text a paragraph at a time and deciphers the context more accurately. In addition, Alex more closely matches the nuances of human speech, so you can more easily understand the meaning of longer text passages in books, articles, and news stories. Alex is so natural he even breathes between long passages.
VoiceOverは、キーボードでの操作に加え、Appleのマルチタッチトラックパッドのジェスチャーを使って操作できます。これは画面読み上げ機能では初めてのことです。指先の動きを感知するトラックパッドの表面が、コンピュータスクリーン上のアクティブウインドウの代わりになり、触れた場所の内容を聴くことができます。指を動かしてドラッグしていけば、項目を連続して読み上げます。1本の指でフリックすると、前後の項目に移動できます。ジェスチャーは覚えるのが簡単で、楽しく使えるうえ、練習のためのモードも用意されています。VoiceOverを使えば、ウェブページ、スプレッドシート、プレゼンテーションをはじめ、あらゆる書類上の項目の配置や、複数の項目の位置関係をまったく新しい感覚で把握できるでしょう。
In addition to keyboard control, VoiceOver is the first screen reader you can control using gestures on an Apple Multi-Touch trackpad. The trackpad is a touch-sensitive surface that can represent the active window on your computer screen. So you can touch it to hear the item under your finger, drag to hear items continuously as you move your finger, and flick with one finger to move to the next or previous item. The gestures are easy to learn and fun to use, and there’s even a practice mode. With VoiceOver you’ll have a brand-new sense of how items are arranged and interrelated on a web page, in a spreadsheet, in a presentation, or in any document. Learn more about VoiceOver gestures
* * *
アップルの「テキスト読み上げ」(text-to-speech)の歴史は古いが、音声合成の技術は Nuance 社のものを使っているようだ。
OS X Daily: “Mac OS X Lion Adds Amazing New Text-to-Speech Voices – Listen to Samples“: 15 May 2011
* * *
Nuance の音声技術
Mac OS X Lion には高品質の「テキスト読み上げ音声」(text-to-speech voices)が多数含まれている。多数の言語に対応できたのは、これまでもウワサのあった音声技術の会社「Nuance」とアップルとの協力の賜物だ。新しい音声は驚くほど高品質で、主要な言語(英語、中国語、ドイツ語、日本語、フランス語、スペイン語、タイ語、インドネシア語、ポルトガル語、ヒンズー語、ロシア語、その他の言語)をほぼカバーしている。
Mac OS X Lion is set to include a wide variety of new high quality text-to-speech voices in a multitude of languages, thanks to a long suspected partnership between Apple and Nuance, a speech technology company. The new voices are of surprisingly good quality and speak in major world languages including English, Mandarin, German, Japanese, French, Spanish, Thai, Bahasa, Portuguese, Hindi, Russian, and many more.
* * *
いろいろな音声サンプルを Nuance のサイトで聞くことができる。
「家政婦のミタ」さんみたいな日本語の声は「キョーコ」さんだそうだ。
サマンサ以外にも各国語の声が聞ける。
アメリカ英語:Samantha
英国英語:Serena
フランス語:Virginie
スペイン語:Monica
日本語:Kyoko
中国語:Mei Ling
* * *
技術が自然のことばに近いところまできていることに驚かされる。
語学教材への活用もあっという間だろう・・・
アレックスとサマンサの声については、Erica Sadun が1年ほど前に Ars Technica で詳細に解説している。
Ars Technica: “iPhone VoiceServices: Looking under the hood” by Erica Sadun: n.d.
* * *
アレックスとサマンサ
もしアナタがマックのアメリカ英語「アレックス」(Alex)の声に慣れているなら、「サマンサ」(Samantha)の声は少し機械的に聞こえるかもしれない。それは Alex は音声だけで数百メガバイトを占めるが、アメリカ英語にローカライズされた Samantha は3メガバイト以下しかないからだ。Samantha はシンプルな音声合成技術で、声の質の違いは耳で聞けば明らかだ。
If you’re used to the American English “Alex” voice on the Macintosh, you’ll notice that the “Samantha” voice sounds far more mechanical. That’s because the Alex voice alone occupies several hundred megabytes. In comparison, the US-localized Samantha data on the iPhone clocks in at under 3 megabytes. It’s a simpler synthesis system, and the difference in quality is easily apparent to the ears.
* * *
音声データの量が大きすぎることから、モバイルではアレックスでなくサマンサになったものらしい。
Erica Sadun の記事には彼女が実際にアドレスブックをコントロールする様子のビデオも掲載されている。
これが Siri とどう関係してくるのか大変興味深いところだ。
iPhone の声も慣れてくればまんざらでもない。読み上げスピードの調節でだいぶ聞きやすくなった。
サマンサも、キョーコの声もなかなかのものだ。
・・・おっと、失礼。
ほら、またサマンサが呼んでいる・・・