Pour cela il suffit d'utiliser l'utilitaire tidy
En fait ce petit utilitaire, disponible sur de très nombreuses plateformes, permet de nettoyer ou transformer facilement un document HTML.
Avec seulement quelques options, on peut ainsi transformer un fichier HTML en un fichier XML.
Par exemple, la commande suivante permet d'obtenir en XML, son fichier bookmark Mozilla.
tidy --output-xml yes --char-encoding utf8 < bookmarks.html > bookmarks.xml
Aucun commentaire:
Enregistrer un commentaire