in

DotNetSide

Dot Net South Italy Developers User Group

Tips

Convertire HTML in Testo

Autore: Stefano De Mattia

Quella che segue è una funzione che converte una stringa HTML in una di testo semplice.

Sono necessari i seguenti Imports:

Imports System.Text
Imports System.Text.RegularExpressions

Il codice della funzione:

''' <summary>
'
'' Funzione che converte una stringa HTML in una di testo semplice
'
'' </summary>
'
'' <param name="html">Stringa da convertire</param>
'
'' <returns>Stinga semplice</returns>
'
'' <remarks></remarks>
Function Html2Text(ByVal html As String) As String
' pattern per la rimozione dei tag HTML
Dim pattern As String = "\<[^\>]*\>"
Dim re As New Regex(pattern, RegexOptions.IgnoreCase)

'qui posso modificare la formattazione sui
'tag che mi interessano, prima di eliminarli ad esempio
'html = html.Replace("<p>", vbCrLf)
'html = html.Replace("<\p>", vbCrLf & vbCrLf)
'html = html.Replace("&nbsp;", " ")
html = html.Replace("<br />", vbCrLf)

'applico l'espressione regolare,
'sostituendo i caratteri speciali con la stringa vuota
html = re.Replace(html, String.Empty)

Return html

End Function
Only published comments... Oct 31 2006, 11:53 AM by VitoA
Filed under: ,

Comments

 

Alessandro Del Sole's Blog said:

February 17, 2007 2:16 PM
 

MADIL said:

Se la funzione "Html2Text()" viene scritta in C# per sostituire "<br />"  bisogna utilizzare Environment.NewLine.

April 2, 2008 12:51 PM
Powered by Community Server (Commercial Edition), by Telligent Systems