Suelta el enlace de cualquier artículo público, página de documentación o post de blog en el campo de arriba. Login walls y SPAs renderizadas en JavaScript no son problema — EnConvert abre la página en un navegador real antes de extraer el contenido.
Convertir URL a Markdown — fuera el HTML, el artículo limpio
Convierte cualquier URL a Markdown limpio con frontmatter YAML. Boilerplate eliminado, enlaces e imágenes preservados. Convertidor online gratuito para pipelines LLM.
Cómo convertir URL a Markdown
Pegar la URL
Renderizado y extracción
La página se carga en una instancia Chromium headless, los banners de cookies se cierran automáticamente, las imágenes con lazy loading se fuerzan a cargar y los headers sticky se neutralizan. Readability aísla el artículo principal, así que navegación, footers y anuncios nunca llegan a la salida.
Descargar Markdown limpio
Se obtiene un archivo .md con un encabezado frontmatter YAML (title, description, links, images) seguido del cuerpo del artículo en GitHub-Flavored Markdown — encabezados, listas, fenced code blocks y URLs absolutas en todo el texto.
¿Por qué convertir una URL a Markdown?
HTML es un formato de renderizado. Sobrecargado de anuncios, navegación, píxeles de tracking y CSS. Cuando lo único que se quiere de una página web es el artículo — las palabras, los encabezados, los bloques de código, los enlaces — Markdown es un contenedor mejor.
Para la ingesta LLM importa todavía más. El HTML plano arrastra al modelo a través de boilerplate que tiene que ignorar. El mismo artículo en Markdown cuesta una fracción de la context window, con la estructura preservada.
Para archivado, Markdown sobrevive. Rediseños de sitios, paywalls, link rot — nada de eso afecta a un archivo .md local. Suéltalo en git, renderízalo en cualquier sitio, haz diff línea por línea.
EnConvert renderiza la página en un navegador real, así que los sitios con JavaScript pesado funcionan igual que los estáticos. Después elimina el boilerplate, resuelve cada enlace e imagen a una URL absoluta y emite GitHub-Flavored Markdown limpio con un bloque frontmatter YAML de metadatos.
URL vs Markdown
| Característica | URL | Markdown |
|---|---|---|
| Contenido extraído | Página HTML completa | Solo el cuerpo del artículo |
| Tamaño del archivo | A menudo varios MB con los assets | Pocos KB de texto |
| LLM-friendly | Boilerplate pesado en tokens | Compacto y estructurado |
| Portable | Se renderiza correctamente solo en navegador | Se renderiza en cualquier sitio — git, editores, SSGs |
| Acceso a metadatos | Enterrado en etiquetas <meta> | Frontmatter YAML al inicio |
Preguntas frecuentes
Un archivo .md UTF-8 con un bloque frontmatter YAML que contiene url, title, description, links e images, seguido del cuerpo del artículo como GitHub-Flavored Markdown. Encabezados, listas, tablas, blockquotes y bloques de código se preservan.
Sí. Las páginas se cargan en un navegador Chromium headless real, así que el renderizado en cliente, las imágenes con lazy loading y la hidratación de SPAs se completan antes de la extracción. No hace falta pre-renderizar nada.
Sí. Cada enlace e imagen del artículo extraído se resuelve contra la URL final de la página tras los redirects, así que la salida Markdown contiene siempre URLs absolutas y clicables. Los enlaces de solo ancla y los enlaces javascript: se desempaquetan a texto plano porque no tienen sentido fuera de la página original.
Sí. Los banners de consentimiento de cookies se cierran automáticamente antes de la extracción. Para páginas bloqueadas se pueden inyectar hasta 50 cookies y 20 headers HTTP custom por request, o pasar credenciales HTTP Basic Auth directamente en el body del request.
Sí — pasa un array de URLs con async_mode=true. La API devuelve un batch_id inmediatamente, procesa cada URL en segundo plano y notifica la finalización por webhook, email o polling de batch-status. También se pueden empaquetar todos los resultados en un único archivo ZIP.
Los code fences heredan una pista de lenguaje de los nombres de clase que coinciden con language-*, lang-*, highlight-source-* y brush:*, además de los atributos data-lang y data-language en la etiqueta <pre> o su <code> anidado. Si no se encuentra ninguna pista, el bloque se cierra sin etiqueta de lenguaje.
Integrar mediante API
Automatiza las conversiones de URL a Markdown en tu aplicación con unas pocas líneas de código.
import requests
url = "https://api.enconvert.com/v1/convert/url-to-markdown"
headers = {"X-API-Key": "sk_YOUR_SECRET_KEY"}
with open("input_file", "rb") as f:
response = requests.post(url, headers=headers, files={"file": f})
with open("output_file", "wb") as f:
f.write(response.content)