Qwen3-TTS+ComfyUIで声劇を作る!AiCutyの5人でおしゃべりするよ



2026年1月22日、オープンリリースされた音声合成AI「Qwen3-TTS」、その後さらにComfyUIのカスタムノードとして複数登場しました。これにより、テキストから音声を生成するTTS(Text- to- Speech)がComfyUI環境で手軽に利用可能になりました。多人数での会話生成機能は、キャラクター同士の自然な対話シナリオの作成に新たな可能性をもたらします。
みんな、元気にしてる〜?メイだよっ!💛 今日はね、もうめちゃくちゃビッグニュースをみんなに届けにきたよ!なんと、あのQwen3-TTS がComfyUI で使えるようになったんだって!しかも、AICUコラボクリエイターのTORAKO
https://note.com/unique_lotus6046 さん が可愛くて楽しいチュートリアル動画を作ってくれたの!!これって、つまり、テキストから自然な声劇ドラマが作れちゃうってこと!?

Qwen3-TTSってなぁに?ComfyUIでどう動かすの?
Qwen3-TTSっていうのはね、Text-to- Speech、つまりテキスト(文章)を読み込ませると、まるで人間が話してるみたいに自然な音声に変換してくれるすごいAIモデルのことだよ!これまでもいろんなTTSモデルがあったけど、Qwen3-TTSは特に表現力が豊かで、いろんな声や話し方に対応できるのが特徴なの!
それがね、まさかあのComfyUI で動かせるようになるなんて、メイ、びっくりしちゃったよ!ComfyUIって言ったら、画像生成AIのStable Diffusionをノードで繋げて、自分だけのワークフローを作れるめちゃくちゃ楽しいツールじゃん?そこに音声生成AIも組み込めちゃうなんて、もう無限の可能性を感じるっ!✨
こんにちは!TORAKOです!
Qwen3-TTSってComfyUIで動かせないの?と思って調べたら
カスタムノードたくさんありました!というわけで…
今回は、flybirdxxさん作成のカスタムノードを触ってみました!
どんな感じなのか~~記事にしようと思ったのですが、めんどくさ…
~~ 文字にするのは大変な感じだったので全部動画にしました!

(1)「exampleワークフローを触ってみよう」の巻
https://www.youtube.com/watch?v=SngXExmGS6c
(2)「Custom Save Voiceワークフローを触ってみよう」の巻
https://www.youtube.com/watch?v=JGYAuz4gNTY
(3)「Multi-character dialogueワークフローで会話劇を作ってみよう」の巻
https://www.youtube.com/watch?v=SngXExmGS6c
今回は音声生成のワークフローだけ触れましたが、モデルをチューニングするワークフローも追加されていました。

これはちょっと私の知識では使い方がわからないので、ご紹介のみです!
(Lora学習の様に音声データセットでモデルに組み込める感じなのかな?)
もっとシンプルに音声の生成を楽しみたいよ~という方は
こちらのカスタムノードもオススメです!

最後に、動画内で作っていたAiCuty5人の会話をもうちょっと自然な感じになるようにこだわってみました!
※5人の音声はAiCuty公式の決定音声ではありませんが
セリフの書き方や各種設定でまだまだ改善の余地はありそうですね!
(つまりは…これも沼です!時間がとける~~\(^o^)/)
以上、AICU コラボクリエイターのTORAKOがお送りしました。
次のコンテストにも使えるね〜!動画への感想も歓迎です!
このカスタムノード、本当に使いやすいからみんなもチェックしてみてね!
https://github.com/flybirdxx/ComfyUI-Qwen-TTS
TORAKOさんも常連参加!次回の AICU Lab+勉強会 は2/14予定です
ぜひ参加してね!
チョコより熱い開発体験!2/14は「Claude Code入門」でバイブスを上げよう!
www.aicu.jp AIとコードのバイブスを上げる勉強会「Claude Code入門」で、バレンタインに爆速開発を学ぼう。初心者から管理職まで
https://www.aicu.jp/post/260129?srsltid=AfmBOopNNkT_96oQ3K_rxpxw_xKy5qm-2BGpaDaqVvHBHGalKPeXl4YD
この記事に「いいね!」と思ったら、いいねとフォロー、おすすめをお願いします!

