音声生成について実施しています。
実践した範囲を記載しています。
edge-ttsの実施
colabでセルを実行すると、以下のようなUIが表示されます。

実施例
ライブラリの比較
ssmlを使用するという観点でまとめています。使うには、サービス登録が必要なようで、実際には試せていません。
オープンな環境で使用できるものでは、自然に近いものとしては、edge-ttsがまだましといった感じです。(2026/4)
| ライブラリ | SSML対応 | 日本語 | ネット | 備考 |
|---|---|---|---|---|
edge-tts | ❌(確認範囲) | ✅ | 必要 | Colab でブロックされやすい |
gTTS | ❌ | ✅ | 必要 | シンプルだが制御不可 |
| Google Cloud TTS | ✅ | ✅ | 必要 | APIキー必要・高品質 |
| Amazon Polly | ✅ | ✅ | 必要 | AWSキー必要 |
pyttsx3 | ❌ | △ | 不要 | ローカル・品質低め |
コメント