NotebookLMで多言語解説動画を作ってみる

「いつか読もう」と思っている論文、YouTube動画、そしてPDFファイルなどで溺れていませんか？2025年4月30日、GoogleのNotebookLMに大型アップデートが実施され、ポッドキャスト風の対話音声に変換する「音声概要」機能が日本語を含む多言語に対応しました。

このアップデートにより、NotebookLMの設定に新しく「出力言語」が追加され、音声やチャットの応答言語をいつでも自由に変更できます。これにより、必要に応じて多言語のコンテンツを作成したり、外国語で教材を学習したりすることも可能になります。
https://notebooklm.google/

右上の「設定」から「出力言語」を切り替えることができます。

また2025年5月3日、NotebookLMの内部の言語モデルが「Gemini 2.0 Flash」から「Gemini 2.5 Flash」にアップデートされました。
（音声概要機能はGemini 2.0 Flashが使われているようです）

実用レベルをチェック！

明日から開催のSusHi Tech Tokyo 2025についての解説動画を多言語で作ってみました。画像はStability AI API で生成しています。

NotebookLMの音声概要は「カスタマイズ」によってさらにフォーカスを変えることができます。

言語やカスタマイズを変えた場合は、音声概要を一度削除して生成しなおします。音声の長さの指定などは制御できるわけではないようですが、品質の高い会話が生成されます。

生成された音声ファイル(wav)と、生成した画像(png)をffmpegを使ってこんな感じのコマンドで合体できます。

ffmpeg -loop 1 -i image.png -i audio.wav -c:v libx264 -tune stillimage -c:a aac -b:a 192k -pix_fmt yuv420p -shortest output.mp4

YouTubeへのアップロードもできますね！

音声概要は、ソースの主要なトピックの要約を、活発な「掘り下げた」ディスカッション形式にした試験運用中の機能です。ご利用にあたっては以下の注意事項をご確認ください。

Originally published at note.com/aicu on May 7, 2025.