HTML Tidy nasce proprio per questo scopo: correggere l'HTML non valido e riordinare il codice sorgente di una pagina. Inizialmente sviluppato da un membro del W3C, è poi passato nelle mani dei volontari di sourceforge. Scritto in C è un'applicativo ma anche una libreria.
L'applicativo è a linea di comando ed ha tante opzioni. Ad esempio si può ripulire un html utilizzando un file di configurazione in questo modo:
tidy -config config.txt -m test.html
o passando direttamente i parametri
tidy –m –-uppercase-tags no –-word-2000 yes test.html
Nota: esiste uno speciale parametro
word-2000
utilizzato per rimuovere tutte le cose in più inserite da Word durante il salvataggio.
Nessun commento:
Posta un commento