AI生成

B202 音声生成


音声生成について実施しています。
実践した範囲を記載しています。

edge-ttsの実施

Open In Colab

colabでセルを実行すると、以下のようなUIが表示されます。

実施例

ライブラリの比較

ssmlを使用するという観点でまとめています。使うには、サービス登録が必要なようで、実際には試せていません。
オープンな環境で使用できるものでは、自然に近いものとしては、edge-ttsがまだましといった感じです。(2026/4)

ライブラリSSML対応日本語ネット備考
edge-tts❌(確認範囲)必要Colab でブロックされやすい
gTTS必要シンプルだが制御不可
Google Cloud TTS必要APIキー必要・高品質
Amazon Polly必要AWSキー必要
pyttsx3不要ローカル・品質低め

コメント