【Claude活用⑨後編】684MBの動画がテキストになった。Whisper→Claudeで勉強会の録画を「使える資産」に変えたよ

AI活用

おはよう、後輩A君。

前回は「同じ説明を何度もしなくていいように、勉強会の動画を作った」という話をしたんだよね。今日はその続き。その動画を、Claudeが使える「テキスト」に変えた話をしようか。

1. 動画ってそのままじゃ使いにくいんだよね

前編で作った動画は2本。AIエージェントの講義動画(27MB)と、Claude Coworkで画像ファイルを自動整理するデモ動画(684MB)なんだよね。

勉強会には使えた。でも、動画ってそのままだと「Claudeに渡せない」んだよ。Claudeは動画を直接見ることができないから、「この動画の内容を要約して」って頼もうとしても、そこからは何もできないんだよね。

動画の価値を引き出すには、一度テキストに変換する必要があるんだよ。そのためのツールが、今日の主役「Whisper」なんだよね。

2. WhisperってどんなAIか知ってみようか

WhisperはOpenAIが開発した音声認識AIなんだよ。特徴は3つ。

まず、ローカルで動くんだよね。クラウドに音声を送信しないから、社内会議の録音とかプライバシーが気になる素材でも使いやすいんだよ。

次に、無料で使えるpip3 install openai-whisperというコマンド1つでインストールできるんだよ。

そして、日本語に対応している。languageをjaに指定するだけで、日本語の音声をそのまま文字起こしできるんだよね。

モデルのサイズは tiny / base / small / medium / large があって、大きいほど精度が上がるけど時間もかかるんだよ。今回はsmallを使ったんだよ。

3. 実際に文字起こししてみたよ

2本の動画を順番にWhisperにかけてみたんだよ。

01講義.mov(27MB)
処理時間:1.8分
文字起こし結果:4,893文字

27MBで2分以下。これは思ったより早かったんだよね。Macのローカルで動かしているのに、サクッと終わった感じ。

02デモ.mov(684MB)
処理時間:数十分(バックグラウンドで実行)
文字起こし結果:9,225文字

こっちは684MBもあるから時間がかかったけど、放置しておけばいいだけなんだよね。夜のうちに実行しておいたら、翌朝には終わっていたんだよ。2本合わせて14,118文字。これが素材になるんだよね。

4. 文字起こしの「精度」ってどうなの?

正直に言うと、専門用語はけっこう誤変換されるんだよね。

たとえばこんな感じ。

  • 「Claude Cowork(クロードコアク)」→「コパエロ」「古代ラウド」
  • 「モデル」→「ズノ」
  • 「Antigravity(アンチグラビティ)」→「アンチグラフィティ」

読んだ瞬間「何これ?」ってなるんだよね(笑)。でもね、文脈を読めばだいたいわかるんだよ。「コパエロ」が「Claude Cowork」を指してるって、前後の文章から読み取れるんだよね。

Claudeはこの「なんとなくわかる文章」を読み解くのが得意なんだよ。人間が読んでもわかるレベルの文章なら、Claudeはちゃんと理解してくれるんだよね。

つまり、文字起こしに多少の誤変換があっても、Claudeに渡す素材としては十分使えるんだよ。

5. Claudeに渡したら何が出てきたか

2本分の文字起こしテキスト、合計14,118文字をClaudeに渡して、こんなお願いをしてみたんだよ。

この文字起こしは、社内のAIエージェント勉強会の動画2本分です。講義編とデモ編があります。内容を整理して、「勉強会のまとめドキュメント」として使えるように構造化してください。

そうしたら、Claudeが勉強会の内容を綺麗にまとめてくれたんだよね。

  • チャット型AIとAIエージェントの違い(コーチ vs 選手)
  • Claude Code / Cowork / Antigravityの使い分け
  • デモで実演したファイルリネームの手順と精度
  • 参加者へのおすすめ:まずはCoworkを使ってみよう

動画を最初から見直す必要もなく、重要な内容がテキストで手元に残ったんだよね。「動画の内容を次の記事ネタにしたい」「勉強会の内容をチームにシェアしたい」「後で見返したい」、そういうときにこのワークフローがすごく使えるんだよ。

結論:動画はWhisper→Claudeの2ステップでテキスト資産になるよ

今日やったことを整理するとシンプルなんだよね。

動画 → Whisperで文字起こし → Claudeで要約・整理

これだけで、「再生しないと使えなかった動画」が「いつでも参照できるテキスト資産」に変わるんだよ。勉強会の録画はもちろん、会議の録音、インタビュー音声、自分で録ったボイスメモ、何でも使えるんだよね。

後輩A君も、手元に眠っている動画や音声があったら、一度Whisperにかけてみようか。テキストになった瞬間、Claudeが一気に使いやすくなるんだよ。

【本日のミッション:動画をテキスト資産に変えてみようか】

  • ☐ Whisperをインストールしてみようか(pip3 install openai-whisper
  • ☐ 手元の動画や録音をWhisperで文字起こしてみようか
  • ☐ (後輩A君へ)文字起こしテキストをClaudeに渡してみようか。「素材の精度より、Claudeに渡せる形にすること」が大事なんだよ

前編はこちら → 【Claude活用⑨前編】同じ説明を何度もするのをやめた。動画とAIで勉強会を「仕組み化」した話

タイトルとURLをコピーしました