おはよう、後輩A君。
前回は「同じ説明を何度もしなくていいように、勉強会の動画を作った」という話をしたんだよね。今日はその続き。その動画を、Claudeが使える「テキスト」に変えた話をしようか。
1. 動画ってそのままじゃ使いにくいんだよね
前編で作った動画は2本。AIエージェントの講義動画(27MB)と、Claude Coworkで画像ファイルを自動整理するデモ動画(684MB)なんだよね。
勉強会には使えた。でも、動画ってそのままだと「Claudeに渡せない」んだよ。Claudeは動画を直接見ることができないから、「この動画の内容を要約して」って頼もうとしても、そこからは何もできないんだよね。
動画の価値を引き出すには、一度テキストに変換する必要があるんだよ。そのためのツールが、今日の主役「Whisper」なんだよね。
2. WhisperってどんなAIか知ってみようか
WhisperはOpenAIが開発した音声認識AIなんだよ。特徴は3つ。
まず、ローカルで動くんだよね。クラウドに音声を送信しないから、社内会議の録音とかプライバシーが気になる素材でも使いやすいんだよ。
次に、無料で使える。pip3 install openai-whisperというコマンド1つでインストールできるんだよ。
そして、日本語に対応している。languageをjaに指定するだけで、日本語の音声をそのまま文字起こしできるんだよね。
モデルのサイズは tiny / base / small / medium / large があって、大きいほど精度が上がるけど時間もかかるんだよ。今回はsmallを使ったんだよ。
3. 実際に文字起こししてみたよ
2本の動画を順番にWhisperにかけてみたんだよ。
01講義.mov(27MB)
処理時間:1.8分
文字起こし結果:4,893文字
27MBで2分以下。これは思ったより早かったんだよね。Macのローカルで動かしているのに、サクッと終わった感じ。
02デモ.mov(684MB)
処理時間:数十分(バックグラウンドで実行)
文字起こし結果:9,225文字
こっちは684MBもあるから時間がかかったけど、放置しておけばいいだけなんだよね。夜のうちに実行しておいたら、翌朝には終わっていたんだよ。2本合わせて14,118文字。これが素材になるんだよね。
4. 文字起こしの「精度」ってどうなの?
正直に言うと、専門用語はけっこう誤変換されるんだよね。
たとえばこんな感じ。
- 「Claude Cowork(クロードコアク)」→「コパエロ」「古代ラウド」
- 「モデル」→「ズノ」
- 「Antigravity(アンチグラビティ)」→「アンチグラフィティ」
読んだ瞬間「何これ?」ってなるんだよね(笑)。でもね、文脈を読めばだいたいわかるんだよ。「コパエロ」が「Claude Cowork」を指してるって、前後の文章から読み取れるんだよね。
Claudeはこの「なんとなくわかる文章」を読み解くのが得意なんだよ。人間が読んでもわかるレベルの文章なら、Claudeはちゃんと理解してくれるんだよね。
つまり、文字起こしに多少の誤変換があっても、Claudeに渡す素材としては十分使えるんだよ。
5. Claudeに渡したら何が出てきたか
2本分の文字起こしテキスト、合計14,118文字をClaudeに渡して、こんなお願いをしてみたんだよ。
この文字起こしは、社内のAIエージェント勉強会の動画2本分です。講義編とデモ編があります。内容を整理して、「勉強会のまとめドキュメント」として使えるように構造化してください。
そうしたら、Claudeが勉強会の内容を綺麗にまとめてくれたんだよね。
- チャット型AIとAIエージェントの違い(コーチ vs 選手)
- Claude Code / Cowork / Antigravityの使い分け
- デモで実演したファイルリネームの手順と精度
- 参加者へのおすすめ:まずはCoworkを使ってみよう
動画を最初から見直す必要もなく、重要な内容がテキストで手元に残ったんだよね。「動画の内容を次の記事ネタにしたい」「勉強会の内容をチームにシェアしたい」「後で見返したい」、そういうときにこのワークフローがすごく使えるんだよ。
結論:動画はWhisper→Claudeの2ステップでテキスト資産になるよ
今日やったことを整理するとシンプルなんだよね。
動画 → Whisperで文字起こし → Claudeで要約・整理
これだけで、「再生しないと使えなかった動画」が「いつでも参照できるテキスト資産」に変わるんだよ。勉強会の録画はもちろん、会議の録音、インタビュー音声、自分で録ったボイスメモ、何でも使えるんだよね。
後輩A君も、手元に眠っている動画や音声があったら、一度Whisperにかけてみようか。テキストになった瞬間、Claudeが一気に使いやすくなるんだよ。
【本日のミッション:動画をテキスト資産に変えてみようか】
- ☐ Whisperをインストールしてみようか(
pip3 install openai-whisper) - ☐ 手元の動画や録音をWhisperで文字起こしてみようか
- ☐ (後輩A君へ)文字起こしテキストをClaudeに渡してみようか。「素材の精度より、Claudeに渡せる形にすること」が大事なんだよ
前編はこちら → 【Claude活用⑨前編】同じ説明を何度もするのをやめた。動画とAIで勉強会を「仕組み化」した話

