banner

Notizia

Oct 17, 2023

Come rimuovere i tag HTML in Fogli Google

Se copi dati da pagine web in Fogli Google, potresti includere molto codice HTML indesiderato. Ecco come rimuovere i tag HTML in Fogli Google.

Fogli Google è un ottimo modo per organizzare e analizzare i dati. Come ogni buon software, tuttavia, la spazzatura in entrata equivale a spazzatura in uscita. Se estrai i tuoi dati da altre fonti, potresti ritrovarti con più di quanto ti aspettavi; potresti inavvertitamente importare le informazioni che desideri ma anche un mucchio di tag HTML inutili. Finché non ti libererai di questi tag, non sarai in grado di fare molto con i tuoi dati.

Per fortuna, non è troppo complicato eliminare tutti quei tag HTML e lasciare semplicemente le informazioni che desideri. Ecco come rimuovere i tag HTML in Fogli Google.

I tag HTML fanno parte del codice HyperText Markup Language (HTML) che indica a un browser Web come visualizzare il contenuto di tali tag. Ad esempio, un tag HTML potrebbe indicare al tuo browser di visualizzare una sezione di testo in grassetto o corsivo, oppure di allineare il testo al centro o di creare una cornice in cui è possibile incorporare il contenuto.

Questi tag HTML assumono sempre lo stesso formato. Iniziano con il nome del tag racchiuso tra parentesi angolari, come

, e finiscono con lo stesso tag preceduto da una barra, come
. Le informazioni che desideri estrarre si trovano tra questi tag. Per rendere del testo in grassetto, ad esempio, dovresti utilizzare quanto segue: Hello World!.

Quando copi dati da una pagina web, così come i valori che desideri copiare, potresti anche copiare inavvertitamente anche questi tag HTML. Questi non ti sono utili nel tuo foglio di calcolo, quindi ti consigliamo di rimuoverli e lasciare semplicemente le informazioni che desideri effettivamente.

Puoi creare una formula che esaminerà una cella, rimuoverà tutti i suoi tag HTML e restituirà tutto ciò che resta. La cella originale rimarrà intatta, ma dalla nuova cella verranno rimossi tutti i tag HTML, lasciando solo i dati desiderati. Puoi creare questa formula per una cella e quindi applicarla rapidamente a più celle.

Per rimuovere i tag HTML utilizzando una formula in Fogli Google:

Questa formula funziona utilizzando ilREGEXREPLACE funzione. Questa funzione permette di sostituire parte di una stringa con una stringa diversa. Fornisci il testo da sostituire selezionando la cella contenente i tag HTML.

Quindi fornisci un'espressione regolare che la funzione cercherà. In questo caso l'espressione regolare è:

Questa espressione cerca una stringa che inizia con una parentesi uncinata aperta, contiene almeno un carattere che non sia una parentesi uncinata e termina con una parentesi uncinata chiusa. Come abbiamo visto in precedenza, poiché tutti i tag HTML iniziano e finiscono con parentesi angolari, questa espressione regolare troverà tutte le istanze di questi tag.

La parte finale della formula sostituisce qualsiasi istanza di corrispondenza per l'espressione regolare con nulla. Poiché tutti i tag HTML vengono sostituiti con nulla, tutto ciò che rimane è il testo rimanente.

Un difetto di questo metodo è che, sebbene eliminerà i tag HTML dai tuoi dati, creerà una nuova colonna di dati e ti lascerà comunque anche i dati taggati originali. Se elimini i dati originali, anche i nuovi valori eliminati scompariranno, poiché la formula non ha nulla su cui lavorare.

Puoi copiare e incollare i tuoi dati come valori, ma questo non è l'ideale. Un'alternativa è utilizzare Trova e sostituisci per rimuovere i tag HTML dalle celle e lasciare il risultato nella stessa cella.

Per rimuovere i tag HTML utilizzando Trova e sostituisci in Fogli Google:

Imparare come rimuovere i tag HTML in Fogli Google ti assicura di non dover perdere ore modificando manualmente tutti i tuoi dati per rimuovere i tag indesiderati. Utilizzando uno dei metodi sopra indicati, puoi eliminare rapidamente i tag e lasciare semplicemente i dati di cui hai bisogno. La possibilità di utilizzare le espressioni regolari è un vero toccasana qui; vale sicuramente la pena saperne di più su RegEx, poiché può farti risparmiare un'enorme quantità di tempo.

CONDIVIDERE