アメリカのベンチャーキャピタル会社OpenAIは、元の話者の短く録音された音声サンプルを使用して人間の音声を再現できる生成人工知能技術を開発したと主張している。
OpenAIは金曜日、新しいAI「音声エンジン」を発表した。
同社によると、「Voice Engine」は15秒の音声サンプルと入力されたテキストを使用して人間の音声を生成するという。 「音声エンジン」は、入力されたテキストを元の話者の声に近い声で読み上げます。
同社によると、新モデルではAIが生成した音声を外国語に翻訳することもできるという。 このモデルは、元の話者のネイティブのアクセントを保存できます。
OpenAI は、AI テクノロジーを病気やその他の理由で話すことが困難な人々を助けるために使用できると主張しています。 同社によれば、企業はAI技術を利用して外国に情報を発信することもできるという。
しかし、この種のチャットボットは選挙運動中やその他の状況で誤った情報を広めるために使用される可能性があるとの懸念がある。
OpenAIは「国民の声に似た言論を生成することには重大なリスクが伴い、特に選挙期間中にはそのリスクが大きいことを認識している」と述べた。 »
同社は、リスクの可能性があるため、現時点ではこの技術を広く公開する予定はないとしている。
同氏は、この技術の悪用を防ぐ措置を講じる必要があると述べた。 彼は、有名人の声を生成することを虐待の一種として挙げています。