·6 min read·GUIDE

音声文字起こしの完全ガイド(2026):ポッドキャスト・会議・講演

2026年に音声をテキストに変換する方法。ポッドキャスト、インタビュー、講演、長時間録音を対象。実Word Error Rateデータ、無料vs有料ツール比較、マルチスピーカーワークフロー。

Michael LiuMichael Liu·
文字起こし アプリ音声 文字起こしポッドキャスト 文字起こし講演 文字起こしインタビュー 文字起こし録音 テキスト変換

日本での 「文字起こし アプリ」 検索は月間 27,100件 — ポッドキャストカタログ、会議録音、講演、何時間にも及ぶインタビュー。それぞれが音声より文字として有用。AIが変換を十分に高速かつ安価にした今、音声を未処理のまま放置する理由はもうない。

2026年における「音声を文字起こし」の意味#

3つの実用的な道:

  1. AI文字起こし — クリーン音声で精度92-97%
  2. 人間文字起こし — 精度99%以上、納期24-48時間、料金1分あたり1-2ドル
  3. デバイス上 / 内蔵 — 無料、プライベート、長さ制限(~30分)

6つのツール比較#

ツール最適無料プラン有料話者分離言語WER
Voqusa一般用途、登録不要無制限9.90$/100クレジット80+1.85%
Otter.ai定期会議月300分月16.99$英語優先2.13%
Sonix日本語/中国語/その他30分トライアル10$/時49+~2-3%
Descript編集 + 文字起こし月1時間月12$23~2-3%
Rev.ai (AI)従量課金なし0.25$/分30+~2-4%

ワークフロー1:ポッドキャストエピソード#

45分、2話者のポッドキャスト:

  1. DAWから最終ミックスを書き出す — MP3 64-128 kbps、モノラル
  2. 話者分離付きツールを選ぶ — Voqusa、Otter、Sonix
  3. アップロード(またはURL貼り付け) — Voqusaは登録不要
  4. 5-10分処理待ち
  5. 話者ラベルを確認 — 2話者で約90-95%自動正解
  6. Word/DOCXでエクスポート — エピソード説明文ドラフト用

合計:45分エピソードに約25分。

ワークフロー2:長時間インタビュー#

ジャーナリズム、研究のための1時間ソースインタビュー:

  1. 静かな部屋で良いマイクで録音 — 各話者にUSBラベリエ
  2. 未圧縮 .wav で保存 — ディスクに余裕があれば
  3. タイムスタンプと話者分離の良いツールを選ぶ — Voqusa、Sonix、Rev.ai
  4. アップロード、処理、レビュー — 1時間あたり約20分のレビュー
  5. 公開する引用は音声と照合

機密性の高いインタビュー(匿名情報源、法的、医療)には、デバイス上 OR 明示的なゼロデータ保持ポリシー付きツール。

ワークフロー3:講演を勉強用に#

大学の講義、会議の発表、研修:

  1. 教室で録音 — ほとんどの携帯で十分
  2. 専門語彙対応ツールで文字起こし(化学、ML、法律ラテン語)
  3. タイムスタンプを省いてテキストとして出力
  4. 聴きながら読み直す — 二重感覚入力は記憶を改善

AIが間違いツールである時#

  1. 法廷証言と裁判記録 — 認証された人間サービス
  2. 患者記録に流れる医療口述 — 医療専門サービス
  3. モデルがあまり対応していない言語の音声

精度を最大化する:ツールを変えずに#

90%から96%へ:

  • DAWでゲインを-6dBピークまで上げる
  • 音楽イントロ/アウトロを文字起こし前に削除
  • 長い無音を1秒に切り詰める
  • 専門用語のカスタム語彙リストを追加

よくある質問#

音声ファイルを無料で文字起こしする方法は? 30分以下のファイルなら iPhone Voice Memos の文字起こしまたは Pixel Recorder が無料、デバイス上、プライベート。長いファイルは Voqusa が登録不要の無料文字起こし提供。

2026年のAI文字起こし精度は? クリーンなスタジオ音声で単一話者なら 95-98%。複数話者、アクセント、ノイズで 3-15 ポイント低下。

文字起こしと音声入力の違いは? 文字起こし=既存の音声ファイルからテキスト。音声入力=話しながらドキュメントへリアルタイム。

3時間の音声を1回でアップロードできるか? ほとんどのモダンツールが対応 — Voqusa、Sonix、Rev.ai、Descript。

英語以外の音声を文字起こしする方法は? Sonix が非英語向けに最強(49+言語)、続いて Voqusa(80+言語)。

ツールは文字起こし後に音声を保存するか? 保持期間はバラバラ。Voqusa と Rev は処理後に保持しない、と明記。

どこから始めるか#

ほとんどの「音声ファイルがある、テキストが欲しい」ケースでは、答えは:無料AIツール にアップロードして10分以内に文字起こしを得る。