Ricerche di mercato e il Pharma – Parte XV – Ancora sull’attività di analisi

1099212_43344416
Quando si da avvio alla fase di analisi statistica nelle ricerche di mercato in ambito farmaceutico la prima attività da svolgere è quella della pulizia del dato. Infatti, la raccolta e la sistematizzazione dei dati può determinare degli errori di inserimento (talvolta anche molto grossolani) da parte degli operatori incaricati del data-entry, o di processo da parte dei programmi informatici nella di fase di esportazione dei dati. Lo scopo di questa attività è quello di correggere gli errori più evidenti e di rendere i dati pronti ed utilizzabili per essere analizzati. Altro controllo da effettuare è il controllo di coerenza: ad esempio se in una domanda del questionario viene richiesto di quantificare una dimensione e in quelle successive di dividere tale quantificazione, occorre accertarsi che la somma di tali sottodimensioni sia la medesima del dato riportato nella dimensione principale.

Una volta portate a compimento queste operazioni preliminari occorre procedere alla fase di ordinamento e codifica. Per procedere all’ordinamento occorre individuare dei driver di riferimento, come ad esempio possono essere: l’area geografica, la specializzazione/reparto/area terapeutica (nel caso e unità statistiche che compongono il campione siano medici, responsabili di reparto, ecc…), laddove indicati: diagnosi, trattamenti, farmaci utilizzati, e tutti quelli che possono permettere di ordinare e classificare i dati. 

La codifica, invece, assegna ad ogni unità statistica uno o più codici così da rendere più semplice e diretta sia la classificazione che l’analisi. La codifica può essere la più semplice possibile, attraverso l’impiego di una semplice serie numerica progressiva, o molto complessa, quando ad esempio è prevista per la singola unità statistica l’attribuzione di più di un codice di formato complesso. Solitamente negli istituti mediamente strutturati ogni professionista/azienda/struttura ha già un codice attribuitogli all’atto del suo inserimento nel database dell’universo. Pertanto quando un’unità statistica viene selezionata per prendere parte ad una rilevazione o si sfrutta il codice già presente o al limite se ne aggiunge uno semplice come la serie progressiva. 

Per procedere sia alla pulizia dei dati che all’ordinamento e alla classificazione è necessario fare ricorso a dei tool informatici che siano in grado di trattare una mole più o meno grande di dati: alcuni di questi programmi possono essere SAS, SPSS, R e un genere tutti quelli utilizzati per svolgere attività di analisi statistica. Anche un tool di fogli di calcolo, tipicamente Excel, può essere più che sufficiente per svolgere questo tipo di attività. Stesso discorso vale anche per la codifica, con l’aggiunta che talvolta il match fra i codici già presenti in database e quelli delle unità statistiche che compongono il campione non è sempre così semplice e richiede talvolta dei programmi ad-hoc.

Altro tipo di attività da effettuare qualora nel questionario si sia fatto ricorso a delle domande aperte è quella della classificazione: nella pratica si tratta di raggruppare tutto quanto dichiarato dagli intervistati in maniera non strutturata utilizzando poche frasi, espressioni o parole capaci di riassumere un determinato concetto o dimensione in modo così da rendere più agevole l’analisi. In breve: vengono individuate poche “chiavi” a cui vengono associate più risposte che rientrano nella categoria della chiave. 

La vera e propria attività  di analisi, almeno in ambito quantitativo, si effettua attraverso la distribuzione di frequenze che può riguardare sia caratteri qualitativi che quantitativi (i quali a loro volta possono essere di tipo discreto o continuativo). La distribuzione delle frequenze è resa possibile dalla creazione della cosiddetta matrice dei dati grezzi che raggruppa in sé tutti i dati di tutte le domande effettuate suddivise per le singole unità statistiche. Attraverso di essa è possibile scorporare i dati di interesse e creare delle tavole relative ad ogni singola domanda del questionario. E’ possibile anche analizzare congiuntamente due o più dimensioni differenti per poter avere una visione più complessiva di un dato aspetto della ricerca. I “giochi” che si possono fare partendo dalla matrice grezza sono innumerevoli e parte di questi saranno trattati nei prossimi interventi.

Dino Biselli

Rispondi