URL in Markdown umwandeln — HTML raus, Artikel rein

Beliebige URLs in sauberes Markdown mit YAML-Frontmatter umwandeln. Boilerplate entfernt, Links und Bilder bleiben erhalten. Kostenloser Online-Konverter für LLM-Pipelines.

URL in Markdown konvertieren

1

URL einfügen

Den Link zu einem öffentlichen Artikel, einer Dokumentationsseite oder einem Blog-Post in das Feld oben fallen lassen. Login-Walls und JavaScript-gerenderte SPAs sind kein Problem — EnConvert öffnet die Seite in einem echten Browser, bevor der Inhalt extrahiert wird.

2

Rendern und extrahieren

Die Seite lädt in einer Headless-Chromium-Instanz, Cookie-Banner werden automatisch geschlossen, Lazy-Loading-Bilder zum Laden gezwungen und Sticky-Header neutralisiert. Readability isoliert den Hauptartikel, sodass Navigation, Footer und Werbung nie in die Ausgabe gelangen.

3

Sauberes Markdown herunterladen

Sie erhalten eine .md-Datei mit einem YAML-Frontmatter-Header (title, description, links, images), gefolgt vom Artikeltext in GitHub-Flavored Markdown — Überschriften, Listen, Fenced Code Blocks und durchgehend absolute URLs.

Warum eine URL in Markdown umwandeln?

HTML ist ein Render-Format. Aufgebläht mit Werbung, Navigation, Tracking-Pixeln und CSS. Wenn alles, was Sie von einer Webseite wollen, der Artikel selbst ist — die Wörter, die Überschriften, die Code-Blöcke, die Links — ist Markdown der bessere Container.

Für die LLM-Ingestion zählt das umso mehr. Reines HTML zieht Tokens durch Boilerplate, den das Modell erst durchwaten muss. Derselbe Artikel in Markdown kostet einen Bruchteil des Context-Windows — bei erhaltener Struktur.

Für die Archivierung überlebt Markdown. Site-Redesigns, Paywalls, Link-Rot — nichts davon berührt eine lokale .md-Datei. Ab in git, überall rendern, Zeile für Zeile diffen.

EnConvert rendert die Seite in einem echten Browser, sodass JavaScript-lastige Sites genauso funktionieren wie statische. Anschließend wird Boilerplate entfernt, jeder Link und jedes Bild zu einer absoluten URL aufgelöst und sauberes GitHub-Flavored Markdown mit einem YAML-Frontmatter-Block voller Seitenmetadaten ausgegeben.

URL vs. Markdown

Merkmal URL Markdown
Extrahierter Inhalt Komplette HTML-Seite Nur der Artikeltext
Dateigröße Oft mehrere MB inklusive Assets Ein paar KB Text
LLM-freundlich Token-lastiger Boilerplate Kompakt und strukturiert
Portabel Wird nur im Browser korrekt gerendert Rendert überall — git, Editoren, SSGs
Metadaten-Zugriff Vergraben in <meta>-Tags YAML-Frontmatter ganz oben

Häufig gestellte Fragen

Eine UTF-8-codierte .md-Datei mit einem YAML-Frontmatter-Block (url, title, description, links, images), gefolgt vom Artikeltext als GitHub-Flavored Markdown. Überschriften, Listen, Tabellen, Blockquotes und Code-Blöcke bleiben erhalten.

Ja. Seiten werden in einem echten Headless-Chromium-Browser geladen, sodass Client-Side-Rendering, Lazy-Loading-Bilder und SPA-Hydration vor der Extraktion vollständig abgeschlossen sind. Sie müssen selbst nichts vorrendern.

Ja. Jeder Link und jedes Bild im extrahierten Artikel wird gegen die finale Seiten-URL nach allen Redirects aufgelöst, sodass die Markdown-Ausgabe immer absolute, klickbare URLs enthält. Reine Anker-Links und javascript:-Links werden zu Klartext entpackt, weil sie außerhalb der Originalseite keine Bedeutung haben.

Ja. Cookie-Consent-Banner werden vor der Extraktion automatisch geschlossen. Für geschützte Seiten können Sie pro Request bis zu 50 Cookies und 20 eigene HTTP-Header injizieren oder HTTP-Basic-Auth-Zugangsdaten direkt im Request-Body übergeben.

Ja — übergeben Sie ein Array von URLs mit async_mode=true. Die API gibt sofort eine batch_id zurück, verarbeitet jede URL im Hintergrund und meldet den Abschluss per Webhook, E-Mail-Benachrichtigung oder Batch-Status-Polling. Sie können auch alle Ergebnisse in einem einzigen ZIP-Archiv bündeln.

Code-Fences erben einen Sprach-Hinweis aus Klassennamen, die zu language-*, lang-*, highlight-source-* und brush:* passen, sowie aus den data-lang- und data-language-Attributen am <pre>-Tag oder am verschachtelten <code>-Tag. Wird kein Hinweis gefunden, wird der Block ohne Sprach-Label gefenced.

Per API integrieren

Automatisieren Sie die Konvertierung von URL zu Markdown in Ihrer Anwendung mit wenigen Codezeilen.

import requests

url = "https://api.enconvert.com/v1/convert/url-to-markdown"
headers = {"X-API-Key": "sk_YOUR_SECRET_KEY"}

with open("input_file", "rb") as f:
    response = requests.post(url, headers=headers, files={"file": f})

with open("output_file", "wb") as f:
    f.write(response.content)