NotebookLMで多言語解説動画を作ってみる



「いつか読もう」と思っている論文、YouTube動画、そしてPDFファイルなどで溺れていませんか?2025年4月30日、GoogleのNotebookLMに大型アップデートが実施され、ポッドキャスト風の対話音声に変換する「音声概要」機能が日本語を含む多言語に対応しました。
このアップデートにより、NotebookLMの設定に新しく「出力言語」が追加され、音声やチャットの応答言語をいつでも自由に変更できます。これにより、必要に応じて多言語のコンテンツを作成したり、外国語で教材を学習したりすることも可能になります。
https://notebooklm.google/
右上の「設定」から「出力言語」を切り替えることができます。

また2025年5月3日、NotebookLMの内部の言語モデルが「Gemini 2.0 Flash」から「Gemini 2.5
Flash」にアップデートされました。
(音声概要機能はGemini 2.0 Flashが使われているようです)
実用レベルをチェック!
明日から開催のSusHi Tech Tokyo 2025についての解説動画を多言語で作ってみました。画像はStability AI API で生成しています。
Loading tweet component... Loading tweet component... Loading tweet component... Loading tweet component... Loading tweet component... Loading tweet component... NotebookLMの音声概要は「カスタマイズ」によってさらにフォーカスを変えることができます。 言語やカスタマイズを変えた場合は、音声概要を一度削除して生成しなおします。音声の長さの指定などは制御できるわけではないようですが、品質の高い会話が生成されます。 生成された音声ファイル(wav)と、生成した画像(png)をffmpegを使ってこんな感じのコマンドで合体できます。 ffmpeg -loop 1 -i image.png -i audio.wav -c:v libx264 -tune stillimage -c:a
aac -b:a 192k -pix_fmt yuv420p -shortest output.mp4 Loading tweet component... Loading tweet component... YouTubeへのアップロードもできますね! 音声概要は、ソースの主要なトピックの要約を、活発な「掘り下げた」ディスカッション形式にした試験運用中の機能です。ご利用にあたっては以下の注意事項をご確認ください。 音声概要(音声を含む)は AI によって生成されるため、不正確な情報や音声の乱れが含まれる場合があります。 音声概要は、トピックの包括的な見解や客観的な見解ではなく、単にソースを反映したものです。 音声概要は、ノートブックの [設定] で選択した出力言語で生成されます。 音声概要の生成には数分かかることがあります(生成中に他の操作を行っても問題ありません)。 音声概要を生成または削除するには、ノートブックの編集権限が必要です。 高評価 / 低評価ボタンで音声概要に対するフィードバックを共有できます。 Originally published at note.com/aicu on May 7, 2025.カスタマイズ

注意(公式より)
