Transcripción de Videos de YouTube (2026): 5 Métodos Gratuitos
Cómo descargar la transcripción de cualquier video de YouTube en 2026. Cinco métodos gratis que funcionan en escritorio, móvil y para videos sin subtítulos automáticos. Incluye un flujo por lotes para descargar transcripciones a escala.
Las búsquedas de "transcripción de videos de YouTube" alcanzan 3,600 al mes en México y siguen creciendo — parte de la tendencia global donde estudiantes, investigadores, creadores de contenido y estudiantes de inglés necesitan el texto de un video que no pueden o no quieren volver a ver.
YouTube mismo enterró la función de transcripción detrás de dos clics y la hizo resistente a copiar. Abajo hay cinco métodos gratuitos que funcionan hoy (mayo 2026) en escritorio, móvil y para videos donde YouTube no generó subtítulos automáticos del todo.
Qué significa "descargar una transcripción de YouTube"#
Una transcripción de YouTube es el texto con marcas de tiempo de cada palabra hablada en el video. Dos versiones:
- Subtítulos auto-generados de YouTube — producidos por el sistema de reconocimiento de voz de Google, disponibles minutos después de la subida, 90-95% precisos. Disponibles en 13+ idiomas de origen con auto-traducción a ~130.
- Transcripciones subidas por el creador — cuando el creador sube su propio archivo SRT o VTT. Más precisas (a menudo cerca del 100%), disponibles inmediatamente, pero presentes solo en ~20% de los videos.
Cuando la mayoría dice "quiero descargar una transcripción de YouTube", quiere decir: extraer el texto plano sin marcas de tiempo (para leer, resumir, buscar), o descargar el SRT/VTT con marcas de tiempo (para editar a otro video, accesibilidad o trabajo de traducción).
Los cinco métodos abajo cubren ambos.
Método 1: El panel de transcripción integrado de YouTube (funciona para ~80% de los videos)#
La ruta oficial. Dos clics, texto plano, sin herramientas de terceros. Mejor para uso ocasional en escritorio.
- Abre el video de YouTube en cualquier navegador moderno.
- Debajo del video, haz clic en ... más → Mostrar transcripción. (En la nueva UI de 2026, está en el panel de descripción, justo bajo el título.)
- El panel de transcripción se abre a la derecha, con cada línea con marca de tiempo.
- Para obtener texto plano, haz clic en el menú de tres puntos → Activar/desactivar marcas de tiempo → haz clic en la primera línea, desplázate a la última manteniendo Shift para seleccionar todo → Cmd+C / Ctrl+C.
- Pega en tu documento destino.
Limitaciones: la opción "Mostrar transcripción" no aparece si el creador desactivó subtítulos, si el video no tiene contenido hablado, o si YouTube todavía no genera los subtítulos automáticos (típicamente los primeros 30 minutos después de subir).
Método 2: youtube-transcript-api (Python, para lotes y scripting)#
El método más rápido cuando necesitas transcripciones de varios videos a la vez. Gratis, sin registro, automatizable.
pip install youtube-transcript-api
from youtube_transcript_api import YouTubeTranscriptApi
video_id = 'p3q5zWCw8J4' # la parte después de v= en la URL
transcript = YouTubeTranscriptApi.get_transcript(video_id)
# Texto plano
text = ' '.join([line['text'] for line in transcript])
print(text)
Para descarga por lotes del catálogo completo de un canal:
import json
from youtube_transcript_api import YouTubeTranscriptApi
video_ids = ['ID1', 'ID2', 'ID3']
for vid in video_ids:
try:
t = YouTubeTranscriptApi.get_transcript(vid, languages=['es'])
with open(f'{vid}.json', 'w') as f:
json.dump(t, f)
except Exception as e:
print(f'{vid}: {e}')
Un canal de 50 videos tarda ~2 minutos en descargarse. Funciona en cualquier país y contra cualquier video que tenga subtítulos de YouTube.
Limitación: YouTube a veces limita las solicitudes no autenticadas desde IPs de datacenter. Si obtienes errores 429, corre desde una conexión residencial.
Método 3: La línea de comandos yt-dlp (cualquier idioma, SRT o VTT)#
Para cuando quieres SRT/VTT con marcas de tiempo en un idioma específico, incluyendo los traducidos automáticamente.
brew install yt-dlp # macOS, o 'pip install yt-dlp'
# Subtítulos en español, formato VTT:
yt-dlp --write-auto-sub --sub-lang es --skip-download --sub-format vtt \
"https://www.youtube.com/watch?v=VIDEO_ID"
# Auto-traducido al español:
yt-dlp --write-auto-sub --sub-lang es --skip-download --sub-format vtt \
"https://www.youtube.com/watch?v=VIDEO_ID"
yt-dlp es la opción gratis más poderosa pero requiere comodidad con la línea de comandos. La ventaja es control total: elige idioma, formato, comportamiento de marcas de tiempo, y procesa cualquier número de URLs en lote.
Método 4: Voqusa (pega URL, sin registro, transcribe incluso si YouTube no tiene subtítulos)#
Para videos que no tienen subtítulos de YouTube — un podcast original 100%, un video musical, un video donde el creador desactivó los subtítulos — los métodos 1-3 fallan. La alternativa es re-transcribir el audio desde cero.
- Abre Voqusa.
- Pega la URL de YouTube en el cuadro de entrada.
- Haz clic en Transcribir. Sin registro.
- Espera 1-3 minutos para la extracción de audio + transcripción.
- Descarga como texto plano, SRT o VTT.
Voqusa procesa el audio con gpt-4o-transcribe — la precisión en audio limpio de YouTube es 95%+, a menudo mejor que los subtítulos auto-generados de YouTube. Para la comparación completa, consulta nuestro benchmark Voqusa vs Otter.
El flujo de pegar-URL también funciona para URLs de TikTok, Instagram Reels y Facebook video.
Método 5: Extensiones de navegador (un clic en escritorio)#
Para no-desarrolladores que quieren el flujo más fácil posible:
- YouTube Summary with ChatGPT & Claude (Chrome / Edge)
- YouTube Transcript & Summary (Chrome) — código abierto, sin cuenta
- Glasp (Chrome / Firefox) — resalta y exporta transcripciones de YouTube
Compromisos: las extensiones requieren permisos de acceso a páginas de YouTube. Lee los permisos antes de instalar.
Cómo descargar una transcripción de YouTube en móvil#
Móvil es el caso más difícil. Las apps de YouTube en iOS y Android ambas muestran la transcripción pero la hacen difícil de copiar.
Soluciones:
- Chrome móvil → Modo de escritorio. Toca el menú → "Sitio de escritorio" → recarga. La UI completa de escritorio carga.
- Compartir a una herramienta de transcripción. Desde la app de YouTube, toca Compartir → elige Voqusa.
- YouTube a MP3 luego transcribir. Como último recurso.
Cómo elegir el método correcto#
Cinco escenarios y el método que recomendamos:
- Una sola vez, lectura casual. Método 1 (panel integrado).
- Descarga por lotes de un canal entero. Método 2 (Python).
- Necesitas SRT/VTT en un idioma específico. Método 3 (yt-dlp).
- El video no tiene subtítulos, o necesitas más precisión. Método 4 (Voqusa).
- No técnico, uso diario. Método 5 (extensión).
Preguntas frecuentes#
¿Es gratis descargar una transcripción de YouTube?
Los cinco métodos son gratis. YouTube no cobra por el panel integrado; youtube-transcript-api y yt-dlp son gratis y de código abierto; la transcripción de URL de Voqusa es gratis sin registro.
¿Es legal descargar una transcripción de YouTube? Para uso personal (estudio, investigación, accesibilidad), sí. Para uso comercial o republicación, la ley de copyright aplica al contenido hablado mismo. Citar y atribuir funciona en periodismo e investigación; republicar transcripciones completas no.
¿Puedo descargar una transcripción de YouTube en español?
Sí. YouTube auto-genera subtítulos en 13+ idiomas de origen y los auto-traduce a ~130. Usa el método 2 o 3 con el código es. Para mayor precisión que los subtítulos automáticos de YouTube, re-transcribe con el método 4.
¿Por qué la transcripción de YouTube no copia bien? YouTube intencionalmente hace el panel difícil de copiar — no quieren exportación masiva de subtítulos. Solución: Shift+clic para seleccionar el rango completo, o usa cualquiera de los otros métodos.
¿Puedo descargar una transcripción sin marcas de tiempo?
Sí. En el método 1, desactiva las marcas. En el método 2 (Python), une los campos text sin start/duration. La versión de texto plano es lo que quieres para leer y resumir.
¿Qué tan precisos son los subtítulos automáticos de YouTube? En audio limpio en inglés, 90-95%. La precisión cae 5-15 puntos porcentuales con voz acentuada, ruido o audio no-inglés. Para mejor precisión, usa un servicio dedicado.
Por dónde empezar#
Para la mayoría de los casos "solo quiero leer lo que dijo este video", el Método 1 (panel integrado de YouTube) alcanza. Dos clics, sin herramientas, texto plano.
Para investigación, lotes o mejor precisión, escala al Método 2 (Python), Método 3 (yt-dlp), o Método 4 (transcripción de URL vía Voqusa — funciona en la misma URL, sin registro).

Building Voqusa to make video transcription free, fast, and accurate for creators in every language.

