Metodologia d'indagine 2016: I metodi di riporto all’universo dei dati campionari
Una volta terminata la fase di raccolta dei dati, vengono applicate procedure di riporto all’universo relative alle imprese sino a 50 dipendenti, mentre per le imprese di maggiori dimensioni si applicano sia delle procedure di inferenza su cluster che stime puntuali dei dati oggetto di indagine a partire da informazioni storiche integrate da elementi desumibili da imprese simili.
Le suddette procedure, per qualunque tipologia di impresa, sono precedute – come precedentemente accennato - da una serie di attività di controllo volte ad individuare e a correggere i dati anomali e le mancate risposte con riferimento a singoli quesiti.
I dati anomali o outliers, cioè quelli che si discostano significativamente rispetto al valore medio delle osservazioni rilevate negli strati omogenei della popolazione, sono esclusi dalle operazioni di riporto. Essi (yi) corrispondono di norma alle osservazioni non comprese in un intervallo di accettabilità rispetto alla varianza rilevata, definito come segue:
Gli outlier così individuati vengono sostituiti dal valore medio
Analogamente vengono attivate delle procedure di individuazione e stima delle mancate risposte o dei valori formalmente non corretti. La fase successiva è rappresentata dalle procedure di stima e riporto all’universo.
Tali procedure sono strettamente connesse allo stimatore scelto e quindi alla strategia campionaria (campionamento stratificato senza ripetizione). Queste elaborano lo stimatore corretto del totale
dove yi sono le osservazioni campionarie e πi le probabilità di inclusione nel campione delle unità della popolazione a cui si riferiscono le osservazioni. Poiché nel campionamento stratificato la probabilità dell’unità i-esima di essere inclusa nel campione dello strato h
pari cioè al tasso di sondaggio nello strato, si ricava che lo stimatore corretto del totale è:
ovvero lo stimatore del campionamento stratificato senza ripetizione è uguale alla somma di tanti stimatori per espansione quanti sono gli strati.
Ovviamente per poter effettuare operazioni di inferenza su un singolo strato vengono poste delle ulteriori condizioni che verificano l’effettiva rappresentatività delle unità campionate, per cui si pone il vincolo che esse:
- siano superiori a una soglia minima predefinita (corrispondente alla numerosità del disegno campionario teorico per gli strati dove questa deve essere garantita);
- rappresentino almeno il 10% della popolazione dello strato.
Se non si verificano queste condizioni, non si effettuano stime per lo strato in questione, ma si passa a un l livello di aggregazione immediatamente superiore rilasciando progressivamente le variabili di stratificazione in ordine inverso di importanza.