Convertir une URL en Markdown — HTML dehors, article propre

Convertir n'importe quelle URL en Markdown propre avec frontmatter YAML. Boilerplate retiré, liens et images préservés. Convertisseur en ligne gratuit pour pipelines LLM.

Résultat

Comment convertir URL en Markdown

1

Coller l'URL

Déposez le lien d'un article public, d'une page de documentation ou d'un post de blog dans le champ ci-dessus. Login walls et SPAs en JavaScript : aucun problème — EnConvert ouvre la page dans un vrai navigateur avant d'extraire le contenu.

2

Rendu et extraction

La page se charge dans une instance Chromium headless, les bandeaux cookies sont fermés automatiquement, les images en lazy load sont forcées, les headers sticky neutralisés. Readability isole l'article principal — navigation, footers et publicités ne touchent jamais la sortie.

3

Télécharger un Markdown propre

Vous récupérez un fichier .md avec un en-tête frontmatter YAML (titre, description, liens, images) suivi du corps de l'article en GitHub-Flavored Markdown — titres, listes, code blocks et URLs absolues partout.

Pourquoi convertir une URL en Markdown ?

HTML est un format de rendu. Bourré de publicités, de navigation, de pixels de tracking et de CSS. Quand on ne veut d'une page web que l'article — les mots, les titres, les blocs de code, les liens — Markdown est un meilleur conteneur.

Pour l'ingestion LLM, ça compte encore plus. Le HTML brut traîne le modèle à travers du boilerplate qu'il doit ignorer. Le même article en Markdown coûte une fraction de la context window, structure préservée.

Pour l'archivage, Markdown survit. Refontes de sites, paywalls, link rot — rien de tout ça ne touche un fichier .md local. Drop dans git, rendu n'importe où, diff ligne par ligne.

EnConvert rend la page dans un vrai navigateur, donc les sites lourds en JavaScript fonctionnent comme les statiques. Il retire ensuite le boilerplate, résout chaque lien et image en URL absolue, et émet du GitHub-Flavored Markdown propre avec un bloc frontmatter YAML de métadonnées.

URL vs Markdown

Caractéristique URL Markdown
Contenu extrait Page HTML complète Corps de l'article uniquement
Taille du fichier Souvent plusieurs Mo avec les assets Quelques Ko de texte
LLM-friendly Boilerplate lourd en tokens Compact et structuré
Portable Rendu uniquement dans un navigateur Rendu n'importe où — git, éditeurs, SSGs
Accès aux métadonnées Enfoui dans des balises <meta> Frontmatter YAML en tête de fichier

Questions fréquentes

Un fichier .md UTF-8 avec un bloc frontmatter YAML contenant url, title, description, links et images, suivi du corps de l'article en GitHub-Flavored Markdown. Titres, listes, tableaux, blockquotes et blocs de code sont préservés.

Oui. Les pages sont chargées dans un vrai navigateur Chromium headless, donc le rendu côté client, les images en lazy load et l'hydratation des SPAs sont entièrement terminés avant l'extraction. Aucun pre-render à faire vous-même.

Oui. Chaque lien et image de l'article extrait est résolu contre l'URL finale de la page (après les redirections), donc le Markdown contient toujours des URLs absolues et cliquables. Les liens ancrés uniquement et les liens javascript: sont déballés en texte brut — ils n'ont aucun sens hors de la page d'origine.

Oui. Les bandeaux de consentement cookies sont fermés automatiquement avant l'extraction. Pour les pages verrouillées, vous pouvez injecter jusqu'à 50 cookies et 20 headers HTTP custom par requête, ou passer des identifiants HTTP Basic Auth directement dans le body.

Oui — passez un tableau d'URLs avec async_mode=true. L'API renvoie immédiatement un batch_id, traite chaque URL en arrière-plan et signale la fin par webhook, notification email ou polling de batch-status. Vous pouvez aussi récupérer tous les résultats dans une seule archive ZIP.

Les code fences héritent d'un indice de langue depuis les noms de classes correspondant à language-*, lang-*, highlight-source-* et brush:*, plus les attributs data-lang et data-language sur la balise <pre> ou son <code> imbriqué. Sans indice, le bloc est cloturé sans label de langue.

Intégrer via l'API

Automatisez les conversions URL vers Markdown dans votre application en quelques lignes de code.

import requests

url = "https://api.enconvert.com/v1/convert/url-to-markdown"
headers = {"X-API-Key": "sk_YOUR_SECRET_KEY"}

with open("input_file", "rb") as f:
    response = requests.post(url, headers=headers, files={"file": f})

with open("output_file", "wb") as f:
    f.write(response.content)