·6 min read·GUIDE

音声文字起こしガイド2026年版:音声をテキストに変換する完全ガイド

2026年に音声をテキストに変換する方法。日本での「文字起こし」検索は月間40,500件。iPhone、Android、デスクトップでの手順、6つのツール比較、実際のWord Error Rateデータ。

Michael LiuMichael Liu·
文字起こし音声 文字起こし音声 テキスト変換文字起こし アプリ音声録音 文字起こし録音 文字起こし

日本での 「文字起こし」 検索は月間 40,500件 — 会議、インタビュー、ボイスメモが文字より音声で残ることが多すぎる時代の象徴です。AIが変換を高速かつ安価にした今、音声を未処理のまま残す理由はもうありません。

このガイドは2026年に音声を文字起こしする全過程をカバー — 最近のiPhoneやPixelに組み込まれた無料機能から、1時間の複数話者音声を処理するクラウドAIツールまで。

2026年における「音声文字起こし」の意味#

音声文字起こしは音声ファイルのテキスト版 — 話された言葉を書き起こしたもの、通常はタイムスタンプと(モダンツールでは)話者ラベル付き。

2026年の実用的な経路は2つ:

  1. デバイス上の文字起こし — 音声がデバイスを離れない。Apple、Google、Microsoftが無料提供。
  2. クラウドAI文字起こし — ファイルをアップロード、数分で結果。話者分離、要約、エクスポート形式付き。

方法1:iPhone(無料、デバイス上)#

iPhone 12以降で録音している場合、文字起こしはすでに完了 — 表示されていないだけ。

ボイスメモ(iOS 18+):

  1. 録音を開く
  2. 文字起こしアイコンをタップ
  3. 文字起こしが波形の隣に表示
  4. シェアアイコンをタップしてテキストとしてコピー

iOS 18.2以降、日本語、英語、スペイン語、ポルトガル語、イタリア語、フランス語、ドイツ語、韓国語、中国語で動作。音声は決してデバイスを離れない — センシティブな素材に最適。

方法2:Android(Pixel Recorder)#

Pixel 6以降にはレコーダーアプリ。録音中に文字起こし。

方法3:クラウドAI文字起こし#

ツール無料プラン有料話者分離言語WER
Voqusa無制限、登録不要9.90$/100クレジット80+1.85%
Otter.ai月300分月16.99$英語優先2.13%
Rev.ai (AI)なし0.25$/分30+~2-4%
Sonix30分トライアル10$/時49+~2-3%

ほとんどの「音声があるからテキストが欲しい」ケースでは、Voqusaが最も摩擦の少ない道 — 登録なし、分メーターなし、モデルは私たちのベンチマークで1.85% WERを達成。

精度:「95%」は実際何を意味するか#

業界標準のメトリックは Word Error Rate (WER) — 人間検証済みリファレンスと異なる単語の割合。

2026年5月のベンチマーク(クリーンな音声):

  • Voqusa:1.85% WER、10.4秒の処理時間
  • Otter.ai:2.13% WER、~60-90秒

クリーンなスタジオ音声では、モダンAI文字起こしは人間のリスニング精度の1-2ポイント以内。

WERを早く下げるもの:

  • ノイズ環境:+3-7パーセントポイント
  • 強いアクセント:+2-5 pp
  • 専門用語:+5-15 pp
  • 重なった話者:+5-10 pp

プライバシーと保存#

  1. 音声はモデル訓練に使用されるか? Voqusa:絶対なし。Rev:絶対なし。Otter:無料プランではデフォルトでイエス。
  2. どれくらい保存されるか? Voqusa と Otter は完全削除可能。
  3. どこでホストされるか? US、EU、IN リージョンが GDPR/PIPA への影響。

よくある質問#

無料で文字起こしできるか? はい。iPhone 12+ と Pixel 6+ には無料機能内蔵。長いファイルには Voqusa が登録不要で無料文字起こし提供。

2026年のAI文字起こしの精度は? クリーンなスタジオ音声で単一話者なら95-98%。

文字起こしと音声入力の違いは? 文字起こし=既存の音声ファイル → テキスト。音声入力=話しながらライブで。

3時間の音声を1回でアップロードできるか? ほとんどのモダンツールが対応。

他言語の音声を文字起こしする方法は? Sonix と Voqusa が日本語を自動検出。

ツールは私の音声を保存するか? バラバラ。Voqusa と Rev は処理後に保持しない、と明記。

どこから始めるか#

短く、プライベートなファイルなら:スマホを使う — すでに無料でできる。

長い、複数話者、その他の言語、SRT/DOCXエクスポートが必要なら、Voqusa を登録不要で無料で試す。