Lasciare il link di un articolo pubblico, una pagina di documentazione o un post di blog nel campo qui sopra. Login walls e SPA renderizzate in JavaScript non sono un problema — EnConvert apre la pagina in un vero browser prima di estrarre il contenuto.
Convertire URL in Markdown — via l'HTML, resta l'articolo
Convertire qualsiasi URL in Markdown pulito con frontmatter YAML. Boilerplate rimosso, link e immagini preservati. Convertitore online gratuito per pipeline LLM.
Come convertire URL in Markdown
Incollare l'URL
Rendering ed estrazione
La pagina si carica in un'istanza Chromium headless, i banner cookie vengono chiusi automaticamente, le immagini in lazy loading vengono forzate al caricamento e gli header sticky neutralizzati. Readability isola l'articolo principale, così navigazione, footer e pubblicità non finiscono mai nell'output.
Scaricare Markdown pulito
Si ottiene un file .md con un header frontmatter YAML (title, description, links, images), seguito dal corpo dell'articolo in GitHub-Flavored Markdown — titoli, liste, fenced code block e URL assolute ovunque.
Perché convertire un URL in Markdown?
HTML è un formato di rendering. Sovraccarico di pubblicità, navigazione, tracking pixel e CSS. Quando di una pagina web si vuole solo l'articolo — le parole, i titoli, i blocchi di codice, i link — Markdown è un contenitore migliore.
Per l'ingestione LLM conta ancora di più. L'HTML grezzo trascina il modello attraverso boilerplate che deve ignorare. Lo stesso articolo in Markdown costa una frazione della context window, con la struttura preservata.
Per l'archiviazione, Markdown sopravvive. Redesign di siti, paywall, link rot — niente di tutto questo tocca un file .md locale. Buttarlo in git, renderizzarlo ovunque, fare diff riga per riga.
EnConvert renderizza la pagina in un vero browser, quindi i siti pesanti di JavaScript funzionano come gli statici. Poi rimuove il boilerplate, risolve ogni link e immagine in URL assoluto ed emette GitHub-Flavored Markdown pulito con un blocco frontmatter YAML di metadati.
URL vs Markdown
| Caratteristica | URL | Markdown |
|---|---|---|
| Contenuto estratto | Pagina HTML completa | Solo il corpo dell'articolo |
| Dimensione file | Spesso diversi MB con gli asset | Pochi KB di testo |
| LLM-friendly | Boilerplate pesante in token | Compatto e strutturato |
| Portabile | Renderizzato correttamente solo nel browser | Renderizzato ovunque — git, editor, SSG |
| Accesso ai metadati | Sepolto in tag <meta> | Frontmatter YAML in cima |
Domande frequenti
Un file .md UTF-8 con un blocco frontmatter YAML che contiene url, title, description, links e images, seguito dal corpo dell'articolo come GitHub-Flavored Markdown. Titoli, liste, tabelle, blockquote e blocchi di codice vengono preservati.
Sì. Le pagine vengono caricate in un vero browser Chromium headless, quindi rendering lato client, immagini in lazy loading e idratazione delle SPA si completano prima dell'estrazione. Non serve fare pre-rendering.
Sì. Ogni link e immagine dell'articolo estratto viene risolto contro l'URL finale della pagina dopo i redirect, quindi l'output Markdown contiene sempre URL assolute e cliccabili. I link a solo ancora e i link javascript: vengono trasformati in testo semplice perché non hanno senso fuori dalla pagina originale.
Sì. I banner di consenso cookie vengono chiusi automaticamente prima dell'estrazione. Per pagine bloccate si possono iniettare fino a 50 cookie e 20 header HTTP custom per request, oppure passare credenziali HTTP Basic Auth direttamente nel body del request.
Sì — passare un array di URL con async_mode=true. L'API restituisce immediatamente un batch_id, elabora ogni URL in background e notifica il completamento via webhook, email o polling sullo stato del batch. Si possono anche raggruppare tutti i risultati in un singolo archivio ZIP.
I code fence ereditano un suggerimento di lingua dai nomi di classe che combaciano con language-*, lang-*, highlight-source-* e brush:*, oltre agli attributi data-lang e data-language sul tag <pre> o sul <code> annidato. Quando non viene trovato alcun suggerimento, il blocco viene chiuso senza etichetta di lingua.
Integra tramite API
Automatizza le conversioni da URL a Markdown nella tua applicazione con poche righe di codice.
import requests
url = "https://api.enconvert.com/v1/convert/url-to-markdown"
headers = {"X-API-Key": "sk_YOUR_SECRET_KEY"}
with open("input_file", "rb") as f:
response = requests.post(url, headers=headers, files={"file": f})
with open("output_file", "wb") as f:
f.write(response.content)