·6 min read·GUIDE

Transcripción de Videos de YouTube (2026): 5 Métodos Gratuitos

Cómo descargar la transcripción de cualquier video de YouTube en 2026. Cinco métodos gratis que funcionan en escritorio, móvil y para videos sin subtítulos automáticos. Incluye un flujo por lotes para descargar transcripciones a escala.

Michael LiuMichael Liu·
transcripcion youtubetranscripcion de videos de youtubedescargar transcripcion youtubeyoutube a textotranscribir youtube

Las búsquedas de "transcripción de videos de YouTube" alcanzan 3,600 al mes en México y siguen creciendo — parte de la tendencia global donde estudiantes, investigadores, creadores de contenido y estudiantes de inglés necesitan el texto de un video que no pueden o no quieren volver a ver.

YouTube mismo enterró la función de transcripción detrás de dos clics y la hizo resistente a copiar. Abajo hay cinco métodos gratuitos que funcionan hoy (mayo 2026) en escritorio, móvil y para videos donde YouTube no generó subtítulos automáticos del todo.

Qué significa "descargar una transcripción de YouTube"#

Una transcripción de YouTube es el texto con marcas de tiempo de cada palabra hablada en el video. Dos versiones:

  1. Subtítulos auto-generados de YouTube — producidos por el sistema de reconocimiento de voz de Google, disponibles minutos después de la subida, 90-95% precisos. Disponibles en 13+ idiomas de origen con auto-traducción a ~130.
  2. Transcripciones subidas por el creador — cuando el creador sube su propio archivo SRT o VTT. Más precisas (a menudo cerca del 100%), disponibles inmediatamente, pero presentes solo en ~20% de los videos.

Cuando la mayoría dice "quiero descargar una transcripción de YouTube", quiere decir: extraer el texto plano sin marcas de tiempo (para leer, resumir, buscar), o descargar el SRT/VTT con marcas de tiempo (para editar a otro video, accesibilidad o trabajo de traducción).

Los cinco métodos abajo cubren ambos.

Método 1: El panel de transcripción integrado de YouTube (funciona para ~80% de los videos)#

La ruta oficial. Dos clics, texto plano, sin herramientas de terceros. Mejor para uso ocasional en escritorio.

  1. Abre el video de YouTube en cualquier navegador moderno.
  2. Debajo del video, haz clic en ... másMostrar transcripción. (En la nueva UI de 2026, está en el panel de descripción, justo bajo el título.)
  3. El panel de transcripción se abre a la derecha, con cada línea con marca de tiempo.
  4. Para obtener texto plano, haz clic en el menú de tres puntos → Activar/desactivar marcas de tiempo → haz clic en la primera línea, desplázate a la última manteniendo Shift para seleccionar todo → Cmd+C / Ctrl+C.
  5. Pega en tu documento destino.

Limitaciones: la opción "Mostrar transcripción" no aparece si el creador desactivó subtítulos, si el video no tiene contenido hablado, o si YouTube todavía no genera los subtítulos automáticos (típicamente los primeros 30 minutos después de subir).

Método 2: youtube-transcript-api (Python, para lotes y scripting)#

El método más rápido cuando necesitas transcripciones de varios videos a la vez. Gratis, sin registro, automatizable.

pip install youtube-transcript-api
from youtube_transcript_api import YouTubeTranscriptApi

video_id = 'p3q5zWCw8J4'  # la parte después de v= en la URL
transcript = YouTubeTranscriptApi.get_transcript(video_id)

# Texto plano
text = ' '.join([line['text'] for line in transcript])
print(text)

Para descarga por lotes del catálogo completo de un canal:

import json
from youtube_transcript_api import YouTubeTranscriptApi

video_ids = ['ID1', 'ID2', 'ID3']
for vid in video_ids:
    try:
        t = YouTubeTranscriptApi.get_transcript(vid, languages=['es'])
        with open(f'{vid}.json', 'w') as f:
            json.dump(t, f)
    except Exception as e:
        print(f'{vid}: {e}')

Un canal de 50 videos tarda ~2 minutos en descargarse. Funciona en cualquier país y contra cualquier video que tenga subtítulos de YouTube.

Limitación: YouTube a veces limita las solicitudes no autenticadas desde IPs de datacenter. Si obtienes errores 429, corre desde una conexión residencial.

Método 3: La línea de comandos yt-dlp (cualquier idioma, SRT o VTT)#

Para cuando quieres SRT/VTT con marcas de tiempo en un idioma específico, incluyendo los traducidos automáticamente.

brew install yt-dlp  # macOS, o 'pip install yt-dlp'

# Subtítulos en español, formato VTT:
yt-dlp --write-auto-sub --sub-lang es --skip-download --sub-format vtt \
  "https://www.youtube.com/watch?v=VIDEO_ID"

# Auto-traducido al español:
yt-dlp --write-auto-sub --sub-lang es --skip-download --sub-format vtt \
  "https://www.youtube.com/watch?v=VIDEO_ID"

yt-dlp es la opción gratis más poderosa pero requiere comodidad con la línea de comandos. La ventaja es control total: elige idioma, formato, comportamiento de marcas de tiempo, y procesa cualquier número de URLs en lote.

Método 4: Voqusa (pega URL, sin registro, transcribe incluso si YouTube no tiene subtítulos)#

Para videos que no tienen subtítulos de YouTube — un podcast original 100%, un video musical, un video donde el creador desactivó los subtítulos — los métodos 1-3 fallan. La alternativa es re-transcribir el audio desde cero.

  1. Abre Voqusa.
  2. Pega la URL de YouTube en el cuadro de entrada.
  3. Haz clic en Transcribir. Sin registro.
  4. Espera 1-3 minutos para la extracción de audio + transcripción.
  5. Descarga como texto plano, SRT o VTT.

Voqusa procesa el audio con gpt-4o-transcribe — la precisión en audio limpio de YouTube es 95%+, a menudo mejor que los subtítulos auto-generados de YouTube. Para la comparación completa, consulta nuestro benchmark Voqusa vs Otter.

El flujo de pegar-URL también funciona para URLs de TikTok, Instagram Reels y Facebook video.

Método 5: Extensiones de navegador (un clic en escritorio)#

Para no-desarrolladores que quieren el flujo más fácil posible:

  • YouTube Summary with ChatGPT & Claude (Chrome / Edge)
  • YouTube Transcript & Summary (Chrome) — código abierto, sin cuenta
  • Glasp (Chrome / Firefox) — resalta y exporta transcripciones de YouTube

Compromisos: las extensiones requieren permisos de acceso a páginas de YouTube. Lee los permisos antes de instalar.

Cómo descargar una transcripción de YouTube en móvil#

Móvil es el caso más difícil. Las apps de YouTube en iOS y Android ambas muestran la transcripción pero la hacen difícil de copiar.

Soluciones:

  • Chrome móvil → Modo de escritorio. Toca el menú → "Sitio de escritorio" → recarga. La UI completa de escritorio carga.
  • Compartir a una herramienta de transcripción. Desde la app de YouTube, toca Compartir → elige Voqusa.
  • YouTube a MP3 luego transcribir. Como último recurso.

Cómo elegir el método correcto#

Cinco escenarios y el método que recomendamos:

  1. Una sola vez, lectura casual. Método 1 (panel integrado).
  2. Descarga por lotes de un canal entero. Método 2 (Python).
  3. Necesitas SRT/VTT en un idioma específico. Método 3 (yt-dlp).
  4. El video no tiene subtítulos, o necesitas más precisión. Método 4 (Voqusa).
  5. No técnico, uso diario. Método 5 (extensión).

Preguntas frecuentes#

¿Es gratis descargar una transcripción de YouTube? Los cinco métodos son gratis. YouTube no cobra por el panel integrado; youtube-transcript-api y yt-dlp son gratis y de código abierto; la transcripción de URL de Voqusa es gratis sin registro.

¿Es legal descargar una transcripción de YouTube? Para uso personal (estudio, investigación, accesibilidad), sí. Para uso comercial o republicación, la ley de copyright aplica al contenido hablado mismo. Citar y atribuir funciona en periodismo e investigación; republicar transcripciones completas no.

¿Puedo descargar una transcripción de YouTube en español? Sí. YouTube auto-genera subtítulos en 13+ idiomas de origen y los auto-traduce a ~130. Usa el método 2 o 3 con el código es. Para mayor precisión que los subtítulos automáticos de YouTube, re-transcribe con el método 4.

¿Por qué la transcripción de YouTube no copia bien? YouTube intencionalmente hace el panel difícil de copiar — no quieren exportación masiva de subtítulos. Solución: Shift+clic para seleccionar el rango completo, o usa cualquiera de los otros métodos.

¿Puedo descargar una transcripción sin marcas de tiempo? Sí. En el método 1, desactiva las marcas. En el método 2 (Python), une los campos text sin start/duration. La versión de texto plano es lo que quieres para leer y resumir.

¿Qué tan precisos son los subtítulos automáticos de YouTube? En audio limpio en inglés, 90-95%. La precisión cae 5-15 puntos porcentuales con voz acentuada, ruido o audio no-inglés. Para mejor precisión, usa un servicio dedicado.

Por dónde empezar#

Para la mayoría de los casos "solo quiero leer lo que dijo este video", el Método 1 (panel integrado de YouTube) alcanza. Dos clics, sin herramientas, texto plano.

Para investigación, lotes o mejor precisión, escala al Método 2 (Python), Método 3 (yt-dlp), o Método 4 (transcripción de URL vía Voqusa — funciona en la misma URL, sin registro).