<div dir="ltr"><div class="gmail_default" style="font-size:small">Hey Pablo,</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">> 
One of the not irrelevant tasks for me is finding examples of XML code.<span class="gmail-im"><br></span></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">To clarify, XHTML documents <i>are</i> XML documents. XHTML happens to use a standardized set of XML element and attribute names. All XHTML examples are also XML examples.<br></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">> 
But my worries came from having to sanitize HTML sources (which aren’t</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">That was discussed in the blog post: finding a source of well-formed XHTML documents. There are a number of tools to sanitize HTML, as mentioned in the thread. KeenWrite uses the Java-based JSoup library <a href="https://jsoup.org/">https://jsoup.org/</a> to sanitize HTML and then create an XHTML version.<br></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">All the best!<br></div></div>