26 mars 2003

Comment transformer du HTML en XML ?

Pour cela il suffit d'utiliser l'utilitaire tidy

En fait ce petit utilitaire, disponible sur de très nombreuses plateformes, permet de nettoyer ou transformer facilement un document HTML.

Avec seulement quelques options, on peut ainsi transformer un fichier HTML en un fichier XML.

Par exemple, la commande suivante permet d'obtenir en XML, son fichier bookmark Mozilla.

tidy --output-xml yes      --char-encoding utf8      < bookmarks.html      > bookmarks.xml

Aucun commentaire:

Enregistrer un commentaire