Convert unstructured text to XML

Hi,

I have a large dataset containing a variety of text elements such as paragraphs, tables, and lists. Currently, the equivalent XML markup for each text element is generated manually. I want to automate this process by training a transformer model. Is using a transformer model the best approach for this task? I’m considering treating this as an NLP NER (Named Entity Recognition) problem.
Would this be an appropriate solution?

Original text :

  1. Har et radio- og TV-selskab ret til at forbyde udsendelse og til at opkræve licens til viderespredning af sine gratis programmer, som en hotelvirksomhed modtager gennem en parabolantenne og viderefører pr. koaksialkabel til værelserne til gavn for gæsterne? Udgør denne form for viderespredning en »viderespredning pr. kabel« som omhandlet i artikel 1, stk. 3, i direktiv 93/83/EØF (2), og kan den bevirke, at radio- og TV-selskabet tildeles specifikke rettigheder i tilfælde af en national lovgivning, som tilsyneladende udvider kataloget af de i EU-lovgivningen fastsatte

rettigheder?
Transformed XML :

<table cellpadding="0" cellspacing="0" border="0" width="100%">
<col width="5%"/>
<col width="95%"/>
<tr>
<td valign="top">
<p class="count">1.</p>
</td>
<td valign="top">
<p class="normal">Har et radio- og TV-selskab ret til at forbyde udsendelse og til at opkræve licens til viderespredning af sine gratis programmer, som en hotelvirksomhed modtager gennem en parabolantenne og viderefører pr. koaksialkabel til værelserne til gavn for gæsterne? Udgør denne form for viderespredning en »viderespredning pr. kabel« som omhandlet i artikel 1, stk. 3, i direktiv 93/83/EØF (<span class="note footnote notemarker">
<a id="c-2" href="#t-2">2</a>
</span>), og kan den bevirke, at radio- og TV-selskabet tildeles specifikke rettigheder i tilfælde af en national lovgivning, som tilsyneladende udvider kataloget af de i EU-lovgivningen fastsatte rettigheder?</p>
</td>
</tr>
</table>