Nell'era dei big data appaiono sempre più centrali le esigenze di trattamento dei dati non strutturati, in particolare dati provenienti dal web. Utenti e aziende pubblicano ogni giorno, sotto forma di testi, video e immagini, contenuti che possono avere un grande valore non soltanto informativo ma anche economico.

Il corso ha l'obiettivo di presentare i principali aspetti metodologici e applicativi per trattare tali dati ed estrarne conoscenza utile ad analisti e decisori finali

Ci si concentrerà sulle principali problematiche legate all'analisi di tali dati:

- l'ambiguità del linguaggio parlato e scritto, 

- la classificazione automatica di testi o immagini, 

- la corretta identificazione delle opinioni e del sentiment, 

- la scelta dei modelli di analisi più adatti al tipo di dato e di attività che si vuole avviare

Cosa imparerai

  • Scoprirai come rapportarti con dati non strutturati estratti dal Web, apprenderai le principali tecniche di Text Mining

  • Imparerai a utilizzare strumenti visuali come Orange3 e Rapidminer Studio e a svolgere attività di pre-processing del testo

  • Sarai in grado di svolgere Sentiment Analysis e classificazioni, oltre che Image Analytics

Overview del corso

Il corso prevede un'introduzione iniziale alla Social Media Analytics, attraverso cui le aziende possono monitorare il raggiungimento degli obiettivi di business con dati provenienti dal web.
Seguirà la preparazione dei dati non strutturati per le successive analisi di text mining e image analytics.
Si tratteranno infine algoritmi di sentiment analysis, topic extraction e classificazione su dati scaricati dal web (es. tweet, post da blog e forum, immagini).

Laboratorio
Nella parte pratica di laboratorio si utilizzerà un software open source per scaricare, preparare e analizzare i dati con un approccio visuale, senza dover scrivere codice.
In particolare, sarà possibile:
• scaricare tweet in tempo reale;
• applicare tecniche di pre-processing e pruning;
• produrre word cloud e word list dei testi;
• applicare ai dati la sentiment analysis e la topic extraction.

Con lo stesso software si sperimenteranno poi tecniche di image analytics, con l'obiettivo di classificare e correlare immagini.
Watch Intro Video

Scopri Maestr.ia

Curriculum del corso

Il corso è destinato a professionisti e studenti che vogliono formarsi, o aggiornarsi, sulle principali tecniche di trattamento dei dati non strutturati, ma non hanno specifiche competenze di programmazione.
L’approccio visuale fornito dallo strumento adottato permette una veloce e facile comprensione delle potenzialità di queste tecniche, e nello stesso tempo fornisce molteplici possibilità di analisi e visualizzazione di dati sia strutturati che non.
  • 1

    1° Giorno - Mattina

    • Introduzione iniziale alla Social Media Analytics

    • Preparazione dei dati non strutturati

    • Analisi di text mining e image analytics

  • 2

    1° Giorno - Pomeriggio

    • Algoritmi di sentiment analysis

    • Topic extraction e classificazione su dati scaricati dal web

  • 3

    2° Giorno - Mattina

    • Laboratorio Pratico (scaricare, preparare e analizzare i dati con un approccio visuale, senza dover scrivere codice)
      In particolare, sarà possibile:
      scaricare tweet in tempo reale;
      applicare tecniche di pre-processing e pruning;

Materiale didattico

  • Risorse aggiuntive
    PDF, poadcast, slides e altro materiale integrativo, per garantire una formazione stimolante e interattiva

  • Quiz di fine sezione
    Assicurati di padroneggiare gli argomenti trattati, mettendo alla prova le tue conoscenze con i test di fine capitolo

  • Attestato di fine corso
    Alla fine del corso, riceverai un attestato di completamento e i complimenti da parte di tutto il team IULM AI Lab


Conosci il tuo insegnante

Roberto Boselli

Ricercatore in Informatica presso il Dipartimento di Statistica e Metodi Quantitativi, Università degli Studi di Milano Bicocca. Dal 2008 è anche collaboratore del centro di ricerca CRISP. La sua attività scientifica si è concentrata sin dal dottorato sullo sviluppo di modelli e tecniche di trattamento semantico delle informazioni, la creazione di ontologie, lo studio e le applicazione di linguaggi del Semantic Web.


Domande frequenti

  • Dove si svolge il corso?

    Le lezioni si svolgono on line, attraverso la nostra piattaforma di e-learning

  • Saranno disponibili materiali sul corso?

    Oltre al programma del corso, verranno fornite le slide utilizzate durante le lezioni.

  • Sono necessari pre-requisiti?

    Conoscenze dei principali social media e delle tecniche di base di navigazione in internet; conoscenze di base di informatica e di statistica.

#IORESTOACASA

La Formazione Maestr.ia Online scontata, per contribuire a far ripartire il Paese.
Approfitta della promozione!

Scopri i corsi