Convert unstructured text to XML

Hi,

I have a large dataset containing a variety of text elements such as paragraphs, tables, and lists. Currently, the equivalent XML markup for each text element is generated manually. I want to automate this process by training a transformer model. Is using a transformer model the best approach for this task? I’m considering treating this as an NLP NER (Named Entity Recognition) problem.
Would this be an appropriate solution?

Original text :

  1. Har et radio- og TV-selskab ret til at forbyde udsendelse og til at opkr√¶ve licens til viderespredning af sine gratis programmer, som en hotelvirksomhed modtager gennem en parabolantenne og videref√łrer pr. koaksialkabel til v√¶relserne til gavn for g√¶sterne? Udg√łr denne form for viderespredning en ¬Ľviderespredning pr. kabel¬ę som omhandlet i artikel 1, stk. 3, i direktiv 93/83/E√ėF (2), og kan den bevirke, at radio- og TV-selskabet tildeles specifikke rettigheder i tilf√¶lde af en national lovgivning, som tilsyneladende udvider kataloget af de i EU-lovgivningen fastsatte

rettigheder?
Transformed XML :

<table cellpadding="0" cellspacing="0" border="0" width="100%">
<col width="5%"/>
<col width="95%"/>
<tr>
<td valign="top">
<p class="count">1.</p>
</td>
<td valign="top">
<p class="normal">Har et radio- og TV-selskab ret til at forbyde udsendelse og til at opkr√¶ve licens til viderespredning af sine gratis programmer, som en hotelvirksomhed modtager gennem en parabolantenne og videref√łrer pr. koaksialkabel til v√¶relserne til gavn for g√¶sterne? Udg√łr denne form for viderespredning en ¬Ľviderespredning pr. kabel¬ę som omhandlet i artikel 1, stk. 3, i direktiv 93/83/E√ėF (<span class="note footnote notemarker">
<a id="c-2" href="#t-2">2</a>
</span>), og kan den bevirke, at radio- og TV-selskabet tildeles specifikke rettigheder i tilfælde af en national lovgivning, som tilsyneladende udvider kataloget af de i EU-lovgivningen fastsatte rettigheder?</p>
</td>
</tr>
</table>