Fra le funzioni di Excel c’è anche la possibilità di fare Scraping, cioè copiare dati dal Web. Ecco come impostarlo e come fare.
Il web scraping è l’azione di estrarre dati, informazioni o immagini da un sito web utilizzando un metodo quanto più possibile automatizzato; per semplificare possiamo pensarlo come una specie di copia incolla grandemente semplificato. Copiare dati dal Web di solito è abbastanza laborioso, ma le ultime versioni di Excel dispongono di strumenti che facilitano di gran lunga il lavoro.
Esistono diversi motivi per cui effettuare uno scraping dei siti web: dal raccogliere informazioni per il posizionamento di un sito all’interno dei motori di ricerca ad una comparazione dei prezzi, passando per il monitoraggio delle informazioni sul mercato azionario all’ottenimento in tempo quasi reale dei tassi di cambio delle monete.
Il web scraping è un attività davvero duttile che possiamo utilizzare in mille modi diversi.
Che ci crediate o no, Excel ha la capacità di estrarre dati dai siti web da diverse edizioni: le prime avvisaglie di questa funzione provengono direttamente da Excel 2003 per capirci. Tuttavia con le ultime versioni questi strumenti sono diventati davvero potenti e utilizzabili.
Come effettuare Web Scraping con Excel.
Per cominciare apriamo Excel e creiamo una nuova cartella di lavoro.
Fatto ciò dalla barra multifunzione facciamo clic sulla voce dati; a questo punto cerchiamo nella categoria recupera e trasforma dati la voce importa dal web e facciamoci clic sopra.
A questo punto apparirà una finestra in cui potremo scegliere se effettuare un importazione base o avanzata. Quest’ultima ci sarà utile soltanto se abbiamo bisogno di realizzare uno scraping che si aggiorna nel tempo o cose del genere.
Copiamo nella voce URL il sito web dal quale vogliamo ottenere i dati; per il nostro esempio utilizzeremo questo link.
Lasciamo il computer analizzare l’URL e, dalla finestra, vedremo una lunga lista di possibili dati da scaricare. Facciamo clic su quelli che ci interessano col tasto sinistro del mouse per osservarne un anteprima nella parte destra della finestra.
A questo punto, se dovremo in qualche modo modificare in blocco dei dati (perché ad esempio vogliamo formattarli in un modo specifico) facciamo clic su trasforma dati, altrimenti facciamo clic su carica per inserire direttamente nel documento il contenuto della tabella.
Per il nostro esempio sceglieremo la voce frequently used shortcuts.
A questo punto ci ritroveremo un nuovo foglio di lavoro con i dati inseriti nelle varie celle e con, a destra, la lista delle query che abbiamo fatto al sito.
Facendo doppio clic con tasto sinistro del mouse sulla query apriremo la finestra relativa alla trasformazione dati, per effettuare eventuali modifiche in blocco al contenuto del foglio Excel.
Se vogliamo aggiornare automaticamente i valori che abbiamo ottenuto importando dati dal web possiamo sfruttare le caratteristiche delle query. Facciamo clic col tasto sinistro sulla query nella colonna di destra e poi, dalla barra multifunzione, facciamo clic su struttura tabella.
Facciamo qui clic sulla freccia sotto aggiorna e poi facciamo clic su proprietà connessione.
Mettiamo la spunta su abilita aggiornamento del file, aggiorna ogni xx minuti, aggiorna la connessione e abilita aggiornamento in background.
Dopo aver inserito il numero di minuti facciamo clic su ok.