class: profilo
Tutti i tipi di analisi dei dati
Stefano Bussolon
--- layout: true
--- # Le dimensioni * le domande di ricerca * il tipo di ricerca * la finalità delle analisi * la tipologia di dati * il numero di variabili * il tipo di stima * l'asse temporale * il tipo di analisi inferenziale --- ## La gerarchia della ricerca * paradigma epistemologico (positivismo vs costruttivismo) * framework: le linee guida e l'approccio * metodologia: la combinazione di metodi e tecniche usate in un progetto * metodi di raccolta dei dati (osservazione, interviste, misurazioni, questionari) * tecniche: i metodi di analisi --- ## Paradigmi (1): Positivismo Obbiettivi * oggettività * riproducibilità * misurabilità * falsificazione - approccio sperimentale Questo paradigma predilige dei framework di ricerca **quantitativa** --- ## Paradigmi (2): Costruttivismo Obbiettivi * comprensione del contesto * comprensione del fenomeno * comprensione delle motivazioni e del vissuto degli agenti Questo paradigma predilige dei framework di ricerca **qualitativa** --- ## Costruire teorie, falsificare ipotesi La ricerca qualitativa è più adatta a costruire modelli teorici: grounded theory La ricerca quantitativa è necessaria per falsificare le ipotesi: metodo scientifico --- ## Qualitativa vs quantitativa Qualitativa: paradigma costruttivista, framework qualitativo, raccolta di dati testuali, tecniche di coding Quantitativa: paradigma positivista, framework quantitativo, raccolta di dati quantitativi, tecniche di analisi statistica --- ## Confini sfumati ### Mixed models progetti di ricerca in cui, in parallelo o in sequenza, si usano approcci qualitativi e quantitativi (triangolazione, comprensione, misurazione) ### Quantitizing Fare analisi quantitative su dati qualitativi (es frequenze sui testi, sentiment analysis) --- ## Formato dei dati * dati numerici - ordinali * dati categoriali * dati testuali - quantitizing * dati spaziali * (asse temporale?) * grafi --- ## Numero di variabili analizzate * univariata * bivariata * multivariata --- ## Finalità * descrittiva * esplorativa (grafica, non grafica: pca-factor, cluster) * inferenziale * causale (disegno sperimentale, controllo variabili indipendenti) * predittiva * simulativa * prescrittiva --- ## Analisi univariata L'analisi descrittiva univariata "misura" i valori di una variabile su un campione L'analisi esplorativa grafica univariata rappresenta la distribuzione della variabile --- ## Analisi bi- e multi-variata L'analisi bi-variata (e per estensione, multivariata) descrive e visualizza la relazione fra due variabili. * Tabelle di contingenza, confronto fra medie o mediane, correlazione * Grafici di dispersione, --- ## Quante variabili? Nell'analisi inferenziale è necessario avere un numero limitato di variabili, per poter interpretare i risultati Nei modelli predittivi ha senso aumentare le variabili per privilegiare la capacità predittiva a scapito dell'interpretabilità L'analisi qualitativa può aiutarci a farci un'idea di quali variabili, quali relazioni, quali processi, quali cause sono importanti --- ## Tipo di stima * puntuale * intervallo di confidenza --- ## Asse temporale * cross section (un punto nel tempo) * time series * panel data analysis --- ## Tipo di analisi (quantitativa) * parametrica * non parametrica * simulativa (es bootstrap) --- ## Analisi parametrica Si confrontano le misure con una distribuzione teorica (es t di student, gaussiana) Si basa su alcuni assunti, fra cui quella che la distribuzione del campione non si discosti dalla distribuzione Se gli assunti sono violati, le inferenze possono essere scorrette --- ## Analisi non parametrica Si trasformano le variabili numeriche in variabili ordinali (ranking) e si applicano test su base ordinale. Molti meno assunti, ma si perde "informazione" --- ## Approccio simulativo Attraverso tecniche di ricombinazione casuale si simula la distribuzione dell'errore di campionamento, che costituisce la base per il calcolo inferenziale --- ## Conclusioni * partire dalle domande della ricerca * cosa vogliamo fare: falsificare ipotesi o creare modelli teorici? * misurare, descrivere, fare delle previsioni * esplorare relazioni fra variabili, far emergere fattori impliciti --- ## Approccio iterativo Nella ricerca sperimentale, si iterano le domande di ricerca in base al fatto che le ipotesi siano state verificate o falsificate Nella ricerca qualitativa l'iterazione è finalizzata all'esplorazione del dominio Nei mixed models ricerca qualitativa e quantitativa vengono combinate, o per triangolazione (l'una rafforza l'altra), o per misurazione/inferenza/previsione, o per comprensione dei risultati. --- # Domande?