claude-code.log
LiveTR — 2026.03.29

LiveTR — 動画の英語音声をリアルタイムで日本語にするアプリ

2026.03.29 ·クオ ·約4分で読めます
LiveTR — 動画の英語音声をリアルタイムで日本語にするアプリ

LiveTRとは

PCで再生中の動画の英語音声をリアルタイムに認識して、日本語に翻訳するWindows用アプリです。翻訳結果は字幕として画面にオーバーレイ表示され、日本語で読み上げもしてくれます。

YouTube、Twitch、ローカル動画ファイル。英語の音声が流れていれば、ソースは問いません。

再生中の動画に日本語字幕を重ね、同時に読み上げまで行う——LiveTRのイメージ
再生中の動画に日本語字幕を重ね、同時に読み上げまで行う——LiveTRのイメージ


主な機能

翻訳サービスの設定画面。ローカル翻訳に加え、Google・DeepL・Azure・Amazon もキーを入れるだけで切り替えられる。
翻訳サービスの設定画面。ローカル翻訳に加え、Google・DeepL・Azure・Amazon もキーを入れるだけで切り替えられる。

音声キャプチャから文字起こし・翻訳を経て、字幕表示と読み上げの二系統に分岐するLiveTRの処理の流れ
音声キャプチャから文字起こし・翻訳を経て、字幕表示と読み上げの二系統に分岐するLiveTRの処理の流れ


使い方

  1. アプリを起動します
  2. 音声をキャプチャしたいプロセスを選択します
  3. 「開始」を押すと、音声認識・翻訳・字幕表示・読み上げが始まります

動作環境

項目要件
OSWindows 10 / 11(64bit)
GPUNVIDIA GPU(CUDA 12.x対応・必須)
メモリ16GB以上推奨

GPU必須です。音声認識モデルをリアルタイムで回すので、それなりのスペックが要ります。


開発の話

Claude Codeだけで作りました。期間は約4日。

OLTranslatorが画面のテキストを翻訳するアプリだったので、「じゃあ音声も同じことできないか」と思って作り始めました。OLTranslatorはCopilotで2週間かかったので、それと比べるとかなり速い。もちろん自分がAIコーディングに慣れてきた部分もあるが、CLAUDE.mdでプロジェクトの方針を引き継げることと、設計→指示→レビューのサイクルがClaude Codeだと自然に回るのが大きかった。

こだわったところ

音声認識で拾った文を、どこで切って翻訳に回すか。一文をどこで区切るか、途中で切られてしまったらどう繋げるか。これは翻訳精度に直結するので、かなり気を使いました。

話者の性別判定にもこだわりました。読み上げの声を話者に合わせたかったので、論文や特許を参考にしながらClaude Codeと一緒にロジックを組みました。AivisSpeechには複数の話者モデルがあるので、男性の声なら男性っぽく、女性の声なら女性っぽく読み上げます。

ただ、この性別判定がかなり厄介だった。ピッチだけで判定すると、F1実況みたいに興奮してピッチが上がる場面で男性が女性判定になる。この問題をどう解決したかは「自力じゃ無理なロジック、Claudeと論文から組み立てた話」で詳しく書いた。


ダウンロード

LiveTR — リアルタイム音声翻訳アプリPCで再生中の英語動画をリアルタイムで日本語字幕+読み上げ。BOOTHで配布中。BOOTH

関連記事


このブログ「Claude Code 始めました」は、Claude MAX ユーザーが実際の開発で使いながら学んだことを記録していくサイトです。

# LiveTR# Claude Code