HTMLPurifier est une librairie PHP permettant de nettoyer du
code HTML. Cela peut être utile lorsque l’on a, dans un formulaire,
un RTE et que l’utilisateur copie-colle du texte provenant d’un
éditeur de texte (comme Microsoft Word, par exemple). Après un
premier nettoyage, il est possible que certaines balises demeurent
présentes alors qu’elles sont vides (donc inutiles).
Heureusement avec HTMLPurifier, il est possible de supprimer ces balises vides et donc d'obtenir un code HTML parfaitement propre.
$config = \HTMLPurifier_Config::createDefault();
$config->set('AutoFormat.RemoveEmpty', true);
$HTMLPurifier = new \HTMLPurifier($config);
$str = "<p><p>ok</p><p>ok2</p></p><br><p></p>";
$str = $HTMLPurifier->purify($str);
echo $str ;
// Le code suivant affichera : <p>ok</p><p>ok2</p><br />
Documentation : http://htmlpurifier.org/live/configdoc/plain.html
Exemple : http://htmlpurifier.org/phorum/read.php?3,6656,6656