Epidemiologia e Statistica

Riportiamo i termini più usati in epidemiologia e statistica. Alcune voci sono più comuni nella espressione in lingua inglese; pertanto per ciascuna di esse sarà possibile linkarsi alla corrispondente voce in italiano.
Il glossario verrà aggiornato ed implementato periodicamente con nuovi termini.

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Absolute risk (vai alla voce Rischio assoluto)


Absolute risk increase (ARI) (vai alla voce Incremento assoluto del rischio)


Analitic study
(vai alla voce Studio analitico)


Age-adjusted mortality rate (vai alla voce Tasso di mortalità corretto per età)


Age-specific mortality rate (vai alla voce Tasso di mortalità età-specifico)


Algoritmo

Nel passato, il termine era quasi equivalente a "formula" o a combinazione di formule. Oggi, specialmente nel linguaggio del calcolo automatico, significa una relazione esplicita che permette il calcolo di una quantità. Esistono algoritmi elaborati dalle diverse società scientifiche internazionali sulla base degli studi epidemiologici allo scopo di determinare il rischio cardiovascolare individuale, primo passo nella prevenzione delle malattie cardiovascolari.
Il Rischio Cardiovascolare esprime la probabilità di andare incontro ad un evento cardiovascolare maggiore entro un certo intervallo di tempo (in genere 10 anni). L'algoritmo di Framingham è forse quello più noto e fino a qualche anno fa veniva utilizzato anche nel nostro Paese per la stima del rischio cardiovascolare. L'algoritmo, derivato da Anderson K.M. et al. nel 1991 dallo studio Framingham, calcola la probabilità di un evento cardiovascolare in un determinato intervallo di tempo (di solito 5 e 10 anni), su pazienti di ambo i sessi in età compresa fra 35 e 70 anni, basandosi su 7 fattori di rischio indipendenti: età, sesso, pressione arteriosa sistolica, rapporto colesterolo totale/HDL, fumo, diabete, ipertrofia ventricolare sinistra.In realtà il calcolo del rischio secondo i parametri di Framingham lo sovrastima nelle popolazioni mediterranee rispetto a quelle nordamericane. Da ciò la necessità di realizzare una più corretta stima del rischio basandosi su dati epidemiologici italiani: è quanto ha fatto l'ISS in collaborazione con l' Osservatorio Epidemiologico Italiano. La Carta del rischio elaborata si basa su studi epidemiologici condotti su coorti Italiane; tale strumento è stato approvato dal Ministero della Salute e proposto ai medici per valutare oltre che il rischio cardiovascolare individuale, anche la rimborsabilità dei farmaci in nota 13. Per contro le linee guida europee si basano, per il calcolo del rischio, sullo studio SCORE (Systematic Coronary Risk Evaluation) che condensa i dati emersi da 12 studi di coorte in 12 stati europei ed utilizza l'algoritmo SCORE differenziato per le popolazioni dell'Europa del Nord e del Sud (2 diverse carte del rischio).
Gli algoritmi di calcolo utilizzati nel calcolatore di rischio coronarico sono derivati da studi effettuati su categorie specifiche di pazienti. Sono quindi applicabili a pazienti che possano rientrare in determinati criteri di selezione. Inoltre, entrambi i sistemi di calcolo possono essere applicati esclusivamente in prevenzione primaria: su pazienti, cioè, che non abbiano ancora avuto un evento cardiovascolare (malattia coronarica clinicamente provata, angioplastica o by-pass aorto-coronarico, TIA, ictus, claudicatio intermittente).

  
Anni potenziali di vita persi (Years of potential life lost [YPLL])

Misura dell'impatto di una malattia in termini di mortalità prematura in una popolazione. Si calcolano sulla base di un'aspettativa di vita fissata a priori, generalmente un'età attesa di 65 anni, sommando le differenze tra tale età e l'età alla morte di ogni individuo della popolazione morto prematuramente.


Appaiamento (Matching)
In uno studio caso-controllo, i casi e i controlli sono detti "abbinati" o "appaiati" quando i controlli sono scelti in base a particolari somiglianze con i soggetti individuati come casi. Tra le variabili di appaiamento più frequenti vi sono l'età, il sesso, la condizione sociale, la gravità e la storia precedente di malattia. Casi e controlli sono resi simili al fine di evitare che alcune caratteristiche confondano l'effetto di interesse.


Attack rate (vai alla voce Tasso d'attacco)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Bias
Errore sistematico, o distorsione, presente in uno studio, che si ripercuote sui suoi risultati determinando uno scarto tra risultati ottenuti e quelli che si sarebbero dovuti ottenere in assenza di tale errore. I tre errori sistematici più importanti sono:
a) bias di selezione o di campionamento, quando il campione indagato è stato scelto e assemblato in modo errato;
b) bias di misurazione, quando i metodi o gli strumenti di misurazione non sono adeguati al campione e all'obiettivo dello studio, o sono imprecisi, o sono diversi tra i pazienti studiati;
c) bias da effetti estranei, quando è presente un fattore estraneo di confondimento.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Campione (Sample)
Data una popolazione composta da N unità, con N qualsiasi (anche infinito), si denomina campione l'insieme delle n unità selezionate fra le N che compongono la popolazione. Il campionamento si usa quando si vogliono conoscere uno o più parametri di una popolazione, senza doverne analizzare ogni elemento: questo per motivi di costi intesi in termini monetari, di tempo, di qualità o di disagio.
Le modalità di selezione del campione comprendono:
- campionamento per quote o convenience sampling.
- campionamento ragionato o judgmental sampling.
- campionamento casuale o random sampling.
- campionamento probabilistico o probabilistic sampling.


Campione rappresentativo
Campione di individui le cui caratteristiche corrispondono a quelle della popolazione originale o di riferimento.


Case control study
(vai alla voce Studio caso-controllo)


Case-fatality rate (vai alla voce Tasso di letalità)


Caso (Case)
Soggetto che presenta una malattia, una condizione cronica o che ha subito un certo trauma, cioè che sviluppa un evento, secondo i criteri stabiliti nello studio. I criteri che definiscono un caso possono essere molteplici e non sempre la definizione epidemiologica coincide con quella clinica.


Categoria
Modalità di una variabile nominale.


Cause-specific mortality rate (vai alla voce Tasso di mortalità causa-specifico)


Classe (Class)
Raggruppamento dei valori di una variabile. Il raggruppamento in classi viene generalmente effettuato per analizzare la frequenza di un certo evento. L'ampiezza delle classi viene in genere suggerito dalla qualità dei dati e/o dagli obiettivi dello studio.


Cluster (vai alla voce Gruppo omogeneo)


Cohort study
(vai alla voce Studio di coorte)


Comorbidità (Co-morbidity)
La coesistenza di una malattia nei partecipanti allo studio in aggiunta a quella che è considerata il soggetto dello studio.


Confidence Interval (CI) (vai alla voce Intervallo di confidenza)


Confondimento (Confounding)
Si verifica quando la misura dell'effetto dell'esposizione su un rischio di malattia è distorto da un fattore estraneo (confondente) che è associato con il fattore d'esposizione e la malattia sotto studio. E' una fonte d'errore del singolo studio. E' identificato confrontando la stima grezza del risultato e quella ottenuta dopo aver "aggiustato" per il fattore confondente mediante apposite tecniche statistiche.
Ad esempio, si può attribuire il miglioramento osservato in pazienti affetti da un particolare disturbo ad uno specifico intervento mentre l'effetto è legato alla storia naturale del disturbo, che tende di per sè a migliorare, almeno in una certa proporzione di casi. (vedi anche Fattore confondente)


Confounder
(vai alla voce Fattore confondente)


Control event rate (CER)
(vai alla voce Tasso di eventi nel gruppo di controllo)


Controllo
(vai alla voce Gruppo di controllo)


Coorte (Cohort)
Un gruppo di individui accomunati da un'esperienza o un'esposizione che vengono seguiti nel tempo, e sulla base della quale, in uno studio di coorte o prospettico si può stimare l'incidenza di nuovi casi di malattia o di una certa condizioni di salute.


Crite
ri di inclusione e di esclusione
I criteri di inclusione devono essere presenti, mentre i criteri di esclusione devono essere assenti, perché una persona possa essere considerata "eleggibile" per uno studio.
I criteri di inclusione si riferiscono di solito alla diagnosi, alla gravità della condizione, al sesso, all'età; quelli di esclusione all'assenza di patologie psico-organiche o di disturbi da abuso di sostanze o di particolari trattamenti nel passato. Generalmente, i criteri di esclusione tendono a salvaguardare determinati soggetti a rischio dai possibili danni del trattamento sperimentale.


Cross-sectional study
(vai alla voce Studio trasversale)


Crude mortality rate (vai alla voce Tasso di mortalità grezzo)


Curva normale (Normal curve)
Curva a forma di campana che si ottiene rappresentando graficamente la distribuzione normale.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Dato riservato (vai alla voce Dato sensibile)


Dato sensibile
Informazione su variabili che riguardano la sfera strettamente personale del rispondente. Secondo il Codice sulla protezione dei dati personali (d.lgs. 196/2003), art.4, sono considerati dati sensibili, e dunque la loro raccolta e trattamento sono soggetti sia al consenso dell'interessato sia all'autorizzazione preventiva del Garante per la protezione dei dati personali (art. 26), i dati personali, idonei a rivelare:l'origine razziale ed etnica, le convinzioni religiose, filosofiche o di altro genere, le opinioni politiche, l'adesione a partiti, sindacati, associazioni od organizzazioni a carattere religioso, filosofico, politico o sindacale, lo stato di salute e la vita sessuale


Densità di incidenza
(vai alla voce Tasso di incidenza)


Determinante (Determinant)
Fattore altamente eterogeneo che dà origine ad un effetto (malattia) o ad una sequenza di eventi che sfociano nell'effetto e la cui alterazione induce un cambiamento nella frequenza o nei caratteri della malattia stessa. Nell'accezione comune, per causa si intende un qualsiasi fattore, elemento, circostanza. Con il termine "determinante" si introduce invece il concetto di causa come "fattore capace di incrementare la probabilità" della malattia.


Deviazione quadratica media (vai alla voce Varianza)


Deviazione standard (DS) (Standard deviation [SD])
Indice di dispersione, vale a dire una misura della variabilità di una popolazione o di una variabile. Misura la dispersione dei valori intorno alla media ed è tanto più bassa quanto più i valori delle diverse osservazioni sono concentrati intorno alla media (cioè sono meno dispersi).
Popolazioni con la stessa media possono avere un grado molto diverso di dispersione dei dati. Una maniera per esprimere questa variazione è di utilizzare la media come punto di riferimento di ciascun valore, cioè di calcolare la deviazione di ciascun dato dalla media (il suo "scarto" dalla media). Le deviazioni saranno numeri positivi per tutti i valori al di sopra della media e numeri negativi per tutti i valori al di sotto della media. Se noi sommassimo queste deviazioni il risultato sarebbe 0 (i valori positivi sarebbero elisi dai valori negativi). Quest'approccio non ci consentirebbe pertanto di ottenere una misura della variabilità dei dati. Il problema si risolve elevando al quadrato le deviazioni dalla media (il quadrato di un numero negativo è un numero positivo). Se sommiamo i quadrati delle deviazioni (o "scarti") dalla media e dividiamo questa somma per il numero delle osservazioni otteniamo la deviazione quadratica media (o scarto quadratico medio) o varianza. Per riportare i valori all'unità di misura di partenza possiamo estrarre la radice quadrata della varianza. La radice quadrata della varianza è definita deviazione standard.

La media ±1DS include il 66% dei valori di una distribuzione normale.


Dicotomia
Ripartizione dei membri di una popolazione, o di un campione, in due gruppi. La definizione dei gruppi può basarsi su una variabile quantitativa o qualitativa, o addirittura sulle modalità congiunte di più variabili, anche se, generalmente, la variabile di classificazione è un attributo. Esempi di variabili dicotomiche sono il sesso, la presenza di malattia, l'esposizione.


Differenza del rischio assoluto
La differenza nel rischio di un evento o morte tra una popolazione esposta (al rischio) e una non esposta. (vedi anche Rischio attribuibile)


Dimensione campionaria (vai alla voce Numerosità del campione)


Distorsione (vai alla voce Bias)


Distribuzione asimmetrica
Asimmetrica viene definita la distribuzione di frequenze che presenta sulle code valori estremi con basse frequenze. Si può avere la coda a destra, e in tal caso l'asimmetria si dice positiva, o la coda a sinistra, e in tal caso l'asimmetria si dice negativa. In una distribuzione di frequenze di una variabile continua, la media è condizionata dai valori estremi e, come indici di tendenza centrale, è considerata meno rappresentativa della mediana, la quale non è sensibile ai valori estremi.


Distribuzione binomiale
La binomiale è una distribuzione teorica discreta e finita, per eventi classificati con una variabile binaria (del tipo: maschio/femmina, successo/insuccesso, malato/sano, negativo/positivo). È denominata anche distribuzione di Bernoulli o distribuzione bernoulliana. La distribuzione binomiale fornisce le risposte al problema delle prove ripetute: stima le probabilità che un evento avvenga o non avvenga rispettivamente 0, 1, 2,...i,...n volte, nel corso di n prove identiche ed indipendenti. Le prove possono essere successive oppure simultanee, purché siano tra loro indipendenti e quindi le probabilità dei singoli eventi si mantengano costanti. Uno schema di Bernoulli possiede, in sostanza, le seguenti caratteristiche:
- ogni prova è un esperimento casuale che può avere soltanto due esiti possibili, con probabilità effettive p e q=1-p;
- ogni prova effettuata è indipendente da ogni altra prova e, quindi, in ogni prova la probabilità p di successo è costante.


Distribuzione casuale (vai alla voce Distribuzione di probabilità)


Distribuzione Chi-quadrato
Si dice distribuzione chi-quadrato con n gradi di libertà la distribuzione della somma dei quadrati di n variabili casuali indipendenti, ciascuna delle quali obbedisce ad una legge normale con media aritmetica nulla e varianza uguale a uno. È continua e asimmetrica e definita sull'asse positivo. La media della distribuzione è uguale al numero n delle variabili, mentre la varianza è uguale a 2n. Con un numero molto grande di gradi di libertà (oltre 200) è possibile dimostrare che si ottiene una nuova variabile casuale (Z), normalmente distribuita, con media µ uguale a 0 e deviazione standard uguale a 1. Viene utilizzata per rappresentare variabili che assumono solo valori positivi e su di essa si basano vari test statistici (test Chi-quadrato). Si può ottenere elevando al quadrato una distribuzione normale.


Distribuzione di Fisher
È individuata da n e m gradi di libertà, è asimmetrica e definita sull'asse positivo. Essa corrisponde alla distribuzione del rapporto di 2 variabili casuali indipendenti (A e B), divise per i rispettivi gradi di libertà (n e m). Si può ottenere elevando al quadrato una distribuzione t di Student.


Distribuzione di frequenze
Sistema di organizzazione di serie di dati in modo da poter individuare facilmente quali valori di una variabile sono più frequenti e quali più rari. È generalmente rappresentata attraverso una tabella a due colonne, di cui la prima riporta i valori o le categorie della variabile e la seconda il numero degli individui (delle osservazioni) che assumono ogni valore o categoria.


Distribuzione di Poisson
La distribuzione di Poisson deriva dalla distribuzione binomiale, nel caso in cui il numero di dati (n) è molto grande e la probabilità (p) è molto piccola. (di norma quando p <0,05 e n >100); è utilizzata per eventi che si manifestano sia nello spazio che nel tempo. La poissoniana è una distribuzione teorica discreta, totalmente definita da un solo parametro: la media µ, quando riferita a una popolazione, che deve essere costante.


Distribuzione di probabilità
Dato che la somma delle probabilità di tutti i valori possibili di una variabile è uguale all'unità, questa probabilità totale si distribuirà in un certo modo tra i diversi valori della variabile. Al fine di descrivere una variabile dal punto di vista probabilistico si specifica questa distribuzione, cioè si indica esattamente la probabilità di ciascuno dei valori possibili. Si ottiene una funzione che dà le probabilità del verificarsi di un valore x di una variabile casuale in ragione del valore di x. A seconda del tipo di variabile, si distinguono
DISTRIBUZIONI PER VARIABILI DISCRETE
- distribuzione binomiale
- distribuzione di Poisson
DISTRIBUZIONI PER VARIABILI CONTINUE
- distribuzione normale o gaussiana
- distribuzione di chi quadro
- distribuzione di student


Distribuzione multinominale
La distribuzione multinomiale rappresenta una estensione di quella distribuzione binomiale; si applica a k eventi indipendenti di probabilità p1, p2, ..., pi, ..., pk (la cui somma è uguale a 1) che possono comparire nel corso di n prove indipendenti, successive o simultanee. Permette di calcolare la probabilità di ogni evento possibile, quando determinato solo dal caso.


Distribuzione normale o gaussiana
Si dice che una carattere (o una variabile) si distribuisce secondo una (distribuzione) normale quando nella popolazione la maggior parte degli individui assumono valori medi del carattere (o comunque valori intorno alla media della popolazione), mentre i rimanenti individui presentano i valori estremi a destra e a sinistra dei centrali. È una distribuzione continua, simmetrica, con le code che tendono ad infinito, e graficamente la distribuzione normale ha una forma a campana; coincidono media, moda e mediana. La sua forma è determinata completamente dai valori che assumono due parametri: media µ e dalla varianza s. La distribuzione normale con media uguale a 0 e varianza uguale a 1 è detta distribuzione normale standardizzata e viene spesso indicata con la lettera Z.




Distribuzione normale standardizzata o normale ridotta
Data una variabile X che si distribuisce come una normale, la standardizzazione è una trasformazione che individua una nuova distribuzione, indicata con Z, e consiste nel:
- rendere la media nulla (µ = 0): sottraendo ad ogni valore la media;
-prendere la deviazione standard s come unità di misura (s = 1) della nuova variabile.
La distribuzione normale ridotta viene indicata con N(0,1), che indica appunto una distribuzione normale con media 0 e varianza uguale a 1. La forma della distribuzione non dipende né dalla sua media né dalla sua varianza: è sempre identica, qualunque sia la distribuzione gaussiana considerata.


Distribuzione di Student
È una distribuzione di probabilità teorica con andamento simile alla distribuzione normale ma presenta delle code più alte. La media è sempre uguale a 0 e la varianza è poco maggiore di 1; è completamente determinata dai cosiddetti gradi di libertà. Se la numerosità campionaria è maggiore di 30, la distribuzione t approssima la distribuzione normale, cioè assume una forma molto simile a questa. Qualora ci sia un solo grado di libertà (=1) la distribuzione t di Student è detta distribuzione di Cauchy.


Distribuzione statistica
Insieme dei valori assunti da una variabile in una popolazione. Viene rappresentata in forma di distribuzione di unità o di distribuzione di frequenze.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Effetto Hawthorne
Successi attribuibili al solo fatto di essere parte di uno studio. E' dovuto alle modifiche del comportamento di medici e pazienti nel periodo in cui sanno di essere oggetto di un'osservazione attenta.


Effetto lavoratore sano
Fenomeno osservato inizialmente in studi di malattie occupazionali, da cui risulta che i lavoratori di solito mostrano tassi di mortalità/morbilità più bassi rispetto alla popolazione generale. Tale effetto è causato dal fatto che i soggetti gravemente malati o disabili sono generalmente esclusi (o si auto-escludono) dai posti di lavoro. In studi di coorte occupazionale, se non si tiene conto di questo effetto, i tassi di mortalità/morbilità della popolazione generale potrebbero non essere appropriati per la comparazione con i tassi di mortalità/morbilità della coorte di lavoratori.


Effetto proxy
Termine talvolta utilizzato per indicare l'errore che si verifica nelle risposte ottenute da rispondenti diversi da quelli designati per la rilevazione. Tipicamente, quando una persona è assente, si può ammettere in certe condizioni che risponda in sua vece un familiare. Questo rispondente è detto talvolta proxy.


Effetto simpatia
Espressione che descrive la reazione dei rispondenti ad una indagine sulla popolazione che danno risposte, consciamente o inconsciamente, imprecise, adattandole a quelli che immaginano essere gli obiettivi dell'indagine. In senso esteso si tratta di una forma di condiscendenza che dà origine ad errori di tipo sistematico, soprattutto all'interno di strati caratterizzati da diversità strutturali rispetto alle variabili oggetto di rilevazione. Per esempio, in una indagine caso-controllo, i casi e i controlli possono interpretare in modo differente gli obiettivi, oppure sono i rilevatori che si comportano in modo diverso con i casi e con i controlli.


Effetto vanità
Espressione che descrive la forma di errore distorsivo commesso in una indagine sulla popolazione mediante intervista da rispondenti che danno risposte imprecise, adattandole a quelli che ritengono essere i modelli di risposta socialmente più accettabili. Questo effetto è particolarmente rilevante sulle risposte a domande aventi per oggetto argomenti delicati, come le opinioni politiche, i comportamenti sessuali, quelli illegali e quelli socialmente riprovevoli, nonché la descrizione biografica di eventi lontani nel tempo o poco salienti per l'interpellato etc.


End point
Risultato raccolto al termine dello studio. Si parla di end point primario quando il risultato fornisce la risposta al quesito specifico per cui era stato condotto lo studio. Eventuali risultati aggiuntivi vengono detti end point secondari. Per esempio, uno studio clinico sull'efficacia di un farmaco nel prevenire ogni tipo di evento mortale ha come esito primario la mortalità generale. Se vengono condotte anche altre analisi, per esempio sulla frequenza di infarti non fatali, si parla di esiti secondari. Gli end point secondari dovrebbe essere utilizzati solo come valore aggiuntivo a supporto delle conclusioni ricavate dall'analisi primaria o allo scopo di generare ipotesi di ricerca.


Epidemiologia (Epidemiology)
(dal greco epi= sul, dhmos= popolo e logos= discorso, studio) è la disciplina della medicina che si occupa dello studio della distribuzione e frequenza di malattie e di eventi di rilevanza sanitaria nella popolazione e delle cause che li determinano. Tale disciplina studia quindi le malattie non come processo patologico di un soggetto (oggetto della ricerca clinica), bensì come processo patologico all'interno dell'intera comunità.
Scopi dell'epidemiologia:
- determinare l'origine di una malattie la cui causa è conosciuta
- studiare e controllare una malattia la cui causa è sconosciuta o poco nota
- acquisire informazioni sull'ecologia e sulla storia naturale della malattia
- programmare ed attivare piani di controllo e di monitoraggio della malattia
L'epidemiologia si divide in tre branche: epidemiologia descrittiva, epidemiologia analitica o osservazionale, epidemiologia sperimentale.


Epidemiologia analitica
Aspetto dell'epidemiologia che studia le relazioni causa-effetto tra fattori di rischio e malattie. L'associazione tra esposizione ed evento viene valutata confrontando talune quantità calcolate tra i casi con le stesse calcolate tra i non-casi (controlli). Fanno parte dell'epidemiologia analitica gli studi di coorte (prospettici) e gli studi caso-controllo (retrospettivi), a seconda che la selezione dei gruppi di confronto sia effettuata in funzione dell'esposizione (esposti/non esposti, negli studi di coorte) o in funzione delle patologie (malati/non malati, negli studi caso-controllo).


Epidemiologia descrittiva
Aspetto dell'epidemiologia che studia l'occorrenza di malattie o altre caratteristiche sanitarie nella popolazione e descrive eventi sanitari, come malattie, cause di morte e la presenza di fattori di rischio; riunisce, organizza e sintetizza i dati relativi a "persone" (chi è malato?), "tempo" (quando si sono ammalati?) e "luogo" (dove sono stati sottoposti all'esposizione i malati?) e produce misure di frequenza. Le conclusioni che si ottengono vengono spesso utilizzate come punto di partenza per gli studi di epidemiologia analitica.


Epidemiologia sperimentale
Valuta l'efficacia degli interventi sanitari adottati in seguito a studi epidemiologici. Studi di epidemiologia sperimentale possono essere sia di tipo preventivo (per esempio la valutazione dell'effettiva riuscita di campagne di sensibilizzazione) sia terapeutico (per esempio sperimentazioni sui farmaci e tecniche operatorie). In questo tipo di studi, il ricercatore compie interventi diretti, applicando strategie terapeutiche o preventive a due o più gruppi di soggetti.


Errore
Scostamento fra il dato che si sta esaminando e il suo valore "vero", ossia reale. Tra i tipi di errore si distinguono quelli casuali, che si annullano in media, da quelli sistematici, sempre uguali in direzione e misura. In un'indagine statistica, tra le fonti di errore si annoverano il campionamento, la rilevazione dei dati, la codifica, la registrazione, l'imposizione automatica di codici, l'approssimazione numerica, etc..., nonché l'allontanamento dalla rappresentatività.


Errore standard (della media) (Standard error [of the mean])
L'errore standard viene calcolato come la deviazione standard della variabile diviso la radice quadrata della dimensione campionaria: è quindi influenzato dalla numerosità della popolazione studiata: piú grande è la dimensione dello studio, piú grande sarà l'attendibilità della media.


Esito (vai alla voce End point)


Esposizione (Exposure)
Il contatto con la causa o il possesso della caratteristica che si ipotizza possano essere tra i determinanti del problema di salute oggetto di studio.


Evento
Nel calcolo delle probabilità, con la parola evento si intende ogni fatto che in seguito ad una prova può accadere oppure no. Ad ogni evento è associato un numero reale che è tanto maggiore quanto più è elevata la possibilità che si verifichi l'evento stesso: chiamiamo tale numero probabilità dell'evento. In campo medico-scientifico, con il termine evento ci si riferisce al verificarsi di un esito dicotomico in uno studio come vivo/morto, ammalato/non ammalto, migliorato/peggiorato, eccetera.


Experimental study
(vai alla voce Studio sperimentale)


Exposed group
(vai alla voce Gruppo degli esposti)


Exposition event rate (EER)
(vai alla voce Tasso di eventi nel gruppo di esposizione)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Fattore confondente (Confounder)
Quando si analizza la relazione tra un fattore di esposizione (o un trattamento) ed una malattia, un fattore confondente è un terzo elemento che è indipendentemente associato all'esposizione ed è anche un fattore di rischio per la malattia. Accade così di attribuire all'esposizione effetti causati dal fattore confondente. Se non è possibile "aggiustare" per il fattore confondente, il suo effetto non può essere separato da quello dei fattori sotto studio. (vedi anche confondimento)


Fattore di rischio (Risk factor)
Un aspetto di un comportamento personale o abitudine di vita, un'esposizione ambientale, o una caratteristica ereditaria che è associata con un aumento nell'occorrenza di una particolare malattia, condizione cronica o trauma.


Follow-up
Osservazione per un periodo di tempo di un individuo, di un gruppo o di una popolazione determinate a priori, le cui caratteristiche principali sono state valutate per poter osservare cambiamenti dello stato di salute o di altre variabili


Frazione attribuibile (vai alla voce Frazione eziologica)


Frazione eziologia
Il potenziale di riduzione nell'outcome di malattia conseguente all'eliminazione di un fattore di rischio. Quindi se A è il numero di persone esposte al fattore di rischio che sono affette dalla malattia oggetto di studio e B è il numero di persone esposte che non hanno la malattia, allora la frazione eziologica è data da (A-B)/A. È nota anche con il termine frazione attribuibile.


Frequenza (Frequency)
In statistica descrittiva, la frequenza di un evento (malattia, fattore di rischio, sesso, livelli di istruzione) rappresenta il numero di volte in cui l'evento occorre nel campione o nella popolazione in esame. Si distingue tra frequenza assoluta, cioè il puro dato numerico, e frequenza relativa, o "proporzione", data dal rapporto tra il dato numerico e la somma di tutti i dati. Le frequenze relative sono numeri compresi tra 0 e 1 e che danno somma totale 1: esprimono la percentuale con cui è avvenuto quel particolare evento. Queste frequenze sono spesso rappresentate graficamente tramite istogrammi. La somma "crescente" delle frequenze (se tra gli eventi è possibile dare un ordinamento).


Frequenza cumulativa
In una distribuzione di frequenze, è il numero o la proporzione di casi che presenta una certo valore o uno inferiore a questo. Tale curva, e soprattutto la sua rappresentazione grafica, sono utili per individuare mediana e percentili della distribuzione.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Gaussiana (Gaussian distribution) (vai alla voce Distribuzione normale)


Grafici
La rappresentazione grafica dei dati offre numerosi vantaggi:
- permette di elaborare una sintesi delle informazioni (anche se per realizzarla si devono operare alcune approssimazioni)
- è più facilmente leggibile
- consente una comprensione più immediata dell'andamento del fenomeno.
Il tipo di grafico dipende dal tipo di variabile che si vuol rappresentare.

GRAFICI PER VARIABILI QUALITATIVE

Grafico a barre                                                                                              Grafico a torta

           

GRAFICI PER VARIABILI QUANTITATIVE

Istogramma                                                                                                                   Box plot



 



Gruppo
Insieme di entità che possiedono una o più caratteristiche comuni. Nell'analisi statistica, si fa riferimento all'analisi dei gruppi, ossia alla ricerca di "gruppi omogenei" rispetto a certe caratteristiche definite.


Gruppo degli esposti (Exposed group)
Un gruppo di individui i cui membri sono venuti in contatto con la causa o possiedono la caratteristica che si ipotizza possa essere tra i determinanti del problema di salute oggetto di studio.


Gruppo di controllo (Control group)
Gruppo di individui che non presentano il problema di salute oggetto di interesse in uno studio caso-controllo. La scelta dei controlli deve essere effettuata tra gli individui che abbiano caratteristiche il più simili possibile a quelle dei casi, ma che siano esenti dal problema oggetto di studio. In uno studio caso-controllo il gruppo di controllo è confrontato con quello dei casi al fine di determinare un'eventuale associazione tra esposizione ed evento (cioè tra le caratteristiche degli individui ed il problema studiato).


Gruppo omogeneo (Cluster)
Insieme di entità contigue di una popolazione, per esempio, un gruppo di persone che vivono sotto lo stesso tetto, un blocco di osservazioni ordinate nel tempo o nello spazio, un insieme di punti prossimi nello spazio.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Hazard ratio (HR)
L'hazard ratio è il nome del rischio relativo quando questo è ottenuto con il metodo di Cox ed è quindi ottenuto come rapporto di tassi.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Incidence rate (vai alla voce Tasso di incidenza)


Incidenza (Incidence)
Il numero dei nuovi casi di malattia che si sviluppano in una popolazione specifica nell'arco di tempo stabilito per l'osservazione.
Ci sono due modi per definire l'incidenza
- l'incidenza cumulativa o rischio incidente
- il tasso di incidenza o densità di incidenza


Incidenza cumulativa
E' una proporzione il cui numeratore è il numero di nuovi casi che si verificano nella popolazione in un certo intervallo di tempo, ed il denominatore è il totale della popolazione a rischio nello stesso intervallo. Il suo uso è appropriato quando la popolazione a rischio viene seguita per l'intero periodo di riferimento.


Incremento assoluto del rischio (Absolute risk increase [ARI])
Differenza tra l'incidenza degli esiti sfavorevoli osservata nel gruppo che ha subito l'esposizione e quella osservata nel gruppo di controllo. Un valore superiore a 0 indica un rischio, un valore negativo ha il significato di un effetto benefico o protettivo, un valore pari a 0 indica l'indifferenza tra i due gruppi.


Incremento relativo del rischio (Relative risk increase [RRI])
Rapporto tra incremento assoluto del rischio e incidenza degli esiti sfavorevoli osservata nel gruppo di controllo. È dato da |CER-EER|/CER. Un valore superiore a 0 indica un aumento del rischio, un valore negativo ha il significato di un effetto benefico o protettivo. Un valore pari a 0 indica l'indifferenza trai due gruppi.


Indici di dispersione (o di variabilità)
Sono quantità, calcolate sulla base dei dati, che forniscono una descrizione sintetica di una distribuzione. In particolare gli indici di dispersione - tra cui rientrano la varianza, la deviazione standard e l'intervallo interquartilico - forniscono informazioni su quanto la distribuzione sia addensata attorno ad un indice di tendenza centrale, quindi di quanto sia diffusa.


Indici di posizione (vai alla voce Indici di tendenza centrale)


Indici di tendenza centrale (o di posizione)
Sono quantità, calcolate sulla base dei dati, che forniscono una descrizione sintetica di una distribuzione. In particolare gli indici di tendenza centrale, tra cui rientrano media, moda e mediana, forniscono informazioni su "intorno a dove" si addensi la distribuzione.


Indici di variabilità (vai alla voce Indici di dispersione)


Intervallo di confidenza o di fiducia (IC) (Confidence interval [CI])

Indica un intervallo di valori entro i quali (con una probabilità calcolata del 90 o 95%) possiamo essere confidenti che i dati di una certa popolazione contengono il vero valore sconosciuto. L'IC indica la forza dell'evidenza; se gli intervalli sono ampi l'effetto della stima sarà meno preciso. Più è grande il campione, e più è grande il numero degli eventi attesi, tanto più grande è la confidenza che la vera riduzione del rischio relativo sia vicina al valore ottenuto, perchè gli intervalli di confidenza diventano più piccoli e la "precisione" aumenta.


Intervallo fiduciario (vai alla voce Intervallo di confedenza)


Intervallo interquartilico (Interquartile range) (vai alla voce Range interquartile)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Longitudinal study (vai alla voce Studio longitudinale)

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Marcatore (Marker)
Indicatore della vera causa di un fenomeno. Peculiarità della maggior parte dei marker diagnostici validi è definire un valore-soglia del parametro al di sopra e al di sotto del quale il soggetto è considerato sano o malato ed il medico viene indirizzato verso una od un'altra patologia.


Matching (vai alla voce Appaiamento)


Media, µ (Mean)
Indice di tendenza centrale di una distribuzione o di un insieme di dati, calcolata sommando tutti i valori di un gruppo di misure e dividendo la somma per il numero dei valori nel gruppo. È calcolabile solo per variabili quantitative.


Mediana (Median)
Indice di tendenza centrale per una variabile qualitativa o quantitativa ordinata. È il valore che nella successione dei valori osservati, disposti in ordine crescente o decrescente, occupa la posizione centrale se N è dispari, oppure la media aritmetica dei due dati centrali se N è pari. La mediana è quindi tale che il 50% della popolazione presenta una valore al di sotto ed il restante 50% al di sopra di essa (la mediana identifica quindi il 50° percentile). Rispetto alla media aritmetica fornisce minori informazioni (in quanto tiene solo conto dell'ordinamento dei valori osservati e non della loro entità) tuttavia è più robusta in quanto non risente dei valori estremi.


Metanalisi (Meta-analysis)
Rassegna sistematica della letteratura che riassume i dati attraverso metodi quantitativi. In alcuni casi la metanalisi viene eseguita usando i risultati aggregati riportati da ogni studio, mentre in altri i singoli pazienti di ogni studio vengono "ri-arruolati" come se facessero parte di un solo studio e quindi analizzati di nuovo.


Misura surrogata
Misura sostitutiva di una misura che non può essere quantificata nel corso di uno studio, per esempio misurare la pressione sanguigna al posto degli eventi cardiaci.


Misure di associazione
Le misure di associazione misurano l'associazione tra un fenomeno (esito clinico, malattia, morte) e l'esposizione a un particolare fattore causale di malattia o a un trattamento.
Vi sono 2 tipi principali di misure di associazione:
1) misure assolute, come la riduzione assoluta del rischio (ARR), e il suo inverso, il numero di casi da trattare (NNT), che misurano la differenza tra esposti e non esposti nella frequenza di comparsa del fenomeno studiato;
2) misure relative, come la riduzione relativa del rischio (RRR), il rischio relativo (RR), l'odds ratio (OR), il risk ratio e il rapporto tra i tassi, che misurano il rapporto tra esposti e non esposti nella frequenza di comparsa del fenomeno studiato.
Le misure assolute indicano l'effetto assoluto di un intervento: quanti casi in meno di una determinata malattia posso ottenere eliminando un fattore eziologico. Le misure relative danno invece una misura della forza dell'associazione ma non permettono di valutare l'effetto assoluto di un intervento che dipende - oltre che dalla forza dell'associazione - dalla frequenza di base di quella determinata malattia/condizione in una determinata popolazione.


Misure di dispersione (vai alla voce Indici di dispersione)


Misure di frequenza
In matematica, si distinguono rapporto, proporzione e tasso.
Le misure di frequenza delle malattie devono essere, in generale, indipendenti dalle dimensioni della popolazione; per questo non ha senso esprimere esprimere il numero dei soggetti che presentano un certo carattere in una popolazione utilizzando un valore assoluto.
Di conseguenza, per esprimere la frequenza di un fenomeno (es. una malattia), è più corretto utilizzare una frazione la cui forma generale è indicata nello schema seguente. In questa frazione le unità del numeratore sono comprese nel denominatore: si parla di "proporzione" ed assume sempre un valore compreso fra 0 e 1.

Per "rapporto" si intende invece una frazione in cui il numeratore non è compreso nel denominatore; esso assume un valore compreso fra 0 e +infinito.

Rapporti e proporzioni sono misure statiche, che si intendono effettuate in un determinato istante e nelle quali non viene considerata la variabile tempo.
I "tassi" sono invece misure dinamiche, che rappresentano la variazione di una quantità per la variazione unitaria di un'altra quantità (generalmente il tempo).

Misure di tendenza centrale (vai alla voce Indici di tendenza centrale)


Moda (Mode)
Indice di tendenza centrale rappresenta la modalità più frequente fra quelle osservate in una distribuzione di frequenze. Non richiede calcoli o confronti e la si può definire per qualsiasi tipo di variabile, quantitativa o qualitativa.


Modalità
Un possibile modo di realizzarsi di una variabile statistica. Se le modalità sono valori, la variabile si denomina quantitativa, se le modalità sono espressioni qualitative, la variabile è detta qualitativa. Le modalità qualitative possono essere ordinabili, e allora la variabile si dice ordinale, o su scala ordinale, o non ordinabili, e allora la variabile si dice nominale (significa che le modalità sono solo "nomi"), o sconnessa.


Morbilità (Morbidity)
Frequenza di una certa malattia. È definito come il rapporto tra il numero di soggetti malati e la popolazione totale. È anche detta "morbosità".


Morbosità (Morbidity)
(vai alla voce Morbilità)


Mortalità
Rapporto tra il numero di decessi verificatisi durante un periodo di tempo e la quantità della popolazione media dello stesso periodo.


Mortalità proporzionale
Proporzione di morti in una popolazione attribuibili ad una particolare causa in un certo periodo di tempo. Ogni causa di morte è espressa come percentuale di tutte le morti, e la somma della mortalità proporzionale per tutte le cause deve essere uguale a 100%. Tali proporzioni non sono però tassi di mortalità in quanto il denominatore è costituito da tutte le morti anziché dalla popolazione in cui le morti si verificano.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Normal curve (vai alla voce Curva normale)


Numerosità del campione
Numero di unità incluse nel campione. Si usa anche l'espressione "dimensione del campione".

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Observational study (vai alla voce Studio di coorte)


Odds
Si dice anche probabilità a favore ed è definito come il rapporto tra la probabilità p che si verifichi un certo evento e la probabilità complementare 1-p che non si verifichi:

Odds=p/(1-p)


Odds ratio (OR)
Misura di associazione, calcolata come rapporto tra due odds, utilizzata in alcuni studi epidemiologici (es. studi caso-controllo e cross-sectional) per quantificare la relazione tra l'esposizione ed un outcome di salute. In pratica permette di confrontare la presenza di un fattore di rischio per una certa malattia nel gruppo dei malati (casi) e dei sani (controlli).

(a/c) / (b/d) = (a/b) x (c/d)

Nello studio caso-controllo viene usato calcolato per stimare retrospettivamente il rischio relativo che non è calcolabile (infatti non si possono calcolare le incidenze nei casi e nei controlli). Tale stima è buona soprattutto con malattie rare o popolazioni grandi. Come per il rischio relativo, un valore superiore a 1 indica un aumento di rischio legato all'esposizione, un valore inferiore a 1 ha il significato di un effetto benefico o protettivo. Un valore pari a 1 indica l'indifferenza tra i due esposizioni.


Outcome (vai alla voce End point)


Outlier (vai alla voce Valore abnorme)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Percentile
Insieme di punti che dividono una distribuzione o dei dati ordinati in 100 parti uguali, cioè tali che ognuna contenga 1/100 delle osservazioni. Ad esempio il 5° percentile è il punto della distribuzione al di sotto del quale cade il 5% delle osservazioni ed al di sopra il 95%. Inoltre, il 25° percentile viene chiamato primo quartile, il 50° coincide con il secondo quartile ovvero con la mediana il 75° percentile viene detto terzo quartile.


Person-time (vai alla voce Tempo-persona)


Popolazione
In statistica il concetto di popolazione indica l'insieme completo di tutte le osservazioni possibili di un certo fenomeno. Tutte le elaborazioni statistiche dovrebbero poter disporre di una popolazione di dati, ma spesso ciò non avviene e si deve ricorrere ad un campione, cioè ad un insieme di dati parziale preso, secondo un certo criterio, entro una popolazione teorica o virtuale.


Prevalenza (Prevalence)
E' una misura di frequenza che esprime l'insieme di tutti i casi esistenti in un determinato momento ed in una determinata popolazione. In termini medici ad es. la prevalenza di una malattia è data dal rapporto tra soggetti malati e soggetti malati + soggetti a "rischio" di ammalarsi.


Probabilità
Misura della possibilità che un evento si verifichi.


Proportional Hazards Model (vai alla voce Metodo di Cox)


Proporzione (Proportion)
Frazione il cui numeratore è incluso nel denominatore; è quindi una relazione quantitativa tra una parte ed il tutto, come ad esempio il numero degli eventi verificatisi e tutti quelli possibili (probabilità). La proporzione varia tra 0 e 1, è adimensionale, e può essere espressa come frazione (1/5), come decimale (0,2) o come percentuale (20%). (vedi anche Misure di frequenza)


Prospective study
(vai alla voce Studio prospettico)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Quoziente
In senso esteso, è sinonimo di rapporto statistico. Negli studi demografici ed epidemiologici, un quoziente è il rapporto tra il numero di eventi osservati in un periodo e la popolazione all'inizio del periodo d'osservazione. Lo si può assimilare alla probabilità del verificarsi dell'evento nella popolazione durante il periodo d'osservazione. Se il fenomeno descritto ha una connotazione negativa, lo si denomina anche "rischio". Per esempio, il rischio di malattia in un periodo è dato dal rapporto tra i casi di malattia insorti nel periodo sulla popolazione esente da malattia all'inizio del periodo.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Randomizzazione (Randomization)
Processo di assegnazione casuale dei partecipanti a un gruppo di uno studio. La randomizzazione ha lo scopo di rendere simili i gruppi per le loro caratteristiche.


Range

In una osservazione il range indica l'estensione numerica coperta dai dati a cui si riferisce; si calcola attraverso il minimo e il massimo (rispettivamente il valore più piccolo e il più grande tra le misurazioni):

Range = valore max - valore min.

Se un range è un numero elevato indica che il gruppo è molto distribuito; al contrario un range basso indica che i dati si concentrano su pochi valori e vicini fra loro.


Range interquartile
In una distribuzione identifica i valori compresi tra il 1° e il 3° quartile, cioè tra il 25% e il 75% della popolazione. Il range interquartile ha la proprietà di eliminare l'influenza dei valori estremi e (a differenza del range) di essere relativamente indipendente dalla numerosità del campione. Il range interquartile riunisce il 50% dei valori di una distribuzione, quindi è un'espressione più "raggruppata" della media ±1DS che raccoglie il 66% dei valori di una distribuzione ±1DS.


Rapporto (Ratio)
Relazione matematica tra due grandezze, espresso da una frazione in cui il numeratore non è compreso nel denominatore. (vedi anche Misure di frequenza)


Rapporto degli odds (vai alla voce Odds ratio)


Rapporto dei rischi (Risk ratio) (vai alla voce Rischio relativo)


Rapporto dei tassi (Rate ratio)
È il rapporto di due tassi di incidenza ed esprime l'associazione tra il determinante (ad esempio il sesso femminile) e l'evento.


Rapporto Standardizzato di Mortalità (RSM) (Standardised Mortality Ratio [SMR])
E' il rapporto tra morti osservate e morti attese.


Rate
(vai alla voce Tasso)


Rate ratio (vai alla voce Rapporto dei tassi)


Ratio
(vai alla voce Rapporto)


Regressione di Cox (vai alla voce Metodo di Cox)


Relative risk (vai alla voce Rischio relativo)


Relative risk increase (RRI) (vai alla voce Incremento relativo del rischio)


Retrospective study
(vai alla voce Studio retrospettivo)


Revisione sistematica (Systematic review)
Valutazione di tutti gli studi disponibili su un determinato argomento. Il termine "sistematica" si riferisce al fatto che la revisione deve essere pianificata come un vero e proprio studio preparando un protocollo che esplicita: obiettivi della revisione, modalità di ricerca degli studi, reperimento, valutazione critica e sintesi di tutti gli studi eleggibili per la revisione.


Rischio (Risk)
Probabilità di evenienza di un avvenimento (decesso, malattia) in un dato intervallo di tempo. Tra i rischi studiati in epidemiologia si può citare: la mortalità (l'evento è il decesso), l'incidenza di una malattia o di un danno di salute ben definito. E' evidente che questa probabilità non è la stessa per tutti i soggetti di una popolazione. Il rischio infatti può variare in funzione di certe caratteristiche individuali, come sesso, età, fattori socio-economici o parametri biologici, che vengono denominate "fattori di rischio". Sono fattori di rischio tutte le variabili legate statisticamente all'avvenimento studiato.


Rischio assoluto (Absolute risk)
Il rischio assoluto indica la probabilità che un individuo sperimenti l'esito di interesse nel corso di un periodo di tempo specificato. Il metodo più semplice per calcolarlo è quello dividere il numero di casi (di malattia) osservati per il numero dei pazienti che all'inizio dell'osservazione non avevano la malattia. Il valore che si ottiene può variare da 0 a 1.


Rischio attribuibile


Rischio relativo (Relative risk)
Il rapporto tra incidenza di una malattia negli esposti e incidenza nei non esposti allo stesso fattore di rischio è definito rischio relativo e rappresenta l'eccedenza di rischio degli esposti rispetto ai non esposti

[a/(a+b)]/[c/( c+d)]


Risk factor (vai alla voce Fattore di rischio)


Risk ratio (vai alla voce Rischio relativo)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Sample (vai alla voce Campione)


Sex-specific mortality rate (vai alla voce Tasso di mortalità sesso-specifico)


Sorveglianza epidemiologica
Può essere definita come la raccolta, l'analisi e l'interpretazione continua e sistematica di dati essenziali per la pianificazione, la realizzazione e la valutazione degli interventi di salute pubblica. E' importante notare che questa definizione include la comunicazione retroattiva dei risultati al personale sanitario che è coinvolto nell'adozione di misure appropriate per ridurre il fenomeno in esame. Si distingue dal monitoraggio in quanto attività continua e non episodica o intermittente.


Standard deviation (SD) (vai alla voce Deviazione standard)


Standard error (of the mean) (vai alla voce Errore standard)


Standardised Mortality Ratio (SMR) (vai alla voce Rapporto Standardizzato di Mortalità)


Standardizzazione (Standardizzation)
Come termine statistico, indica un procedimento col quale si rendono più confrontabili i valori di una variabile rilevata in soggetti o centri diversi correggendo per gli eventuali diversi valori di fattori di confondimento. I fattori di confondimento più spesso presi in considerazione sono l'età, il sesso, il livello sociale e la gravità della condizione indagata. E' noto ad esempio che se si vogliono confrontare le mortalità di due popolazioni occorre standardizzare per età, in quanto una maggiore mortalità potrebbe essere dovuta non a peggiori condizioni di salute ma a una maggiore presenza di persone più anziane.


Statistica descrittiva
La statistica descrittiva permette di studiare la globalità del campione. Tranne che in casi particolari non interessa il dato riferito al singolo, ma una sintesi di tutte le informazioni rilevate sulla totalità degli individui intervistati.
Con i metodi di statistica descrittiva si analizza l'andamento della variabile sul campione, rappresentativo della popolazione in studio: la statistica descrittiva raccoglie le informazioni e le sintetitizza attraverso tabelle e indici. I metodi di statistica descrittiva sono diversi secondo il tipo di variabile:
VARIABILI QUALITATIVE
- Tabelle
- Grafici
VARIABILI QUANTITATIVE
- Indici di tendenza centrale
- Indici di dispersione
- Grafici


Stratificazione (Stratification)
Processo attraverso il quale la popolazione coinvolta in uno studio clinico viene suddivisa in sottogruppi in base a determinate caratteristiche di interesse, per esempio: età, sesso, o condizione socioeconomica. È possibile confrontare questi differenti strati in modo separato, per valutare se, per esempio, i gruppi rispondono diversamente a un trattamento o se gli effetti di un trattamento differiscono tra i gruppi.


Studio analitico (Analitic study)
Studio in cui si confrontano gruppi per testare ipotesi, individuare e quantificare associazioni, e identificare cause. Rientrano tra gli studi analitici lo studio di coorte e lo studio caso-controllo.


Studio caso-controllo (Case control study)
In questo tipo di studio si valuta in maniera retrospettiva un gruppo di persone con una malattia o condizione (detti casi) rispetto a un altro gruppo della stessa popolazione che non ha quella malattia o condizione (detti controlli). In particolare, si cerca di identificare l'esposizione a particolari fattori, per suggerire alcune cause possibili della malattia.
I vantaggi sono la facilità di conduzione e il fatto che richiedono campioni meno numerosi degli studi trasversali. Gli svantaggi di questo approccio sono quelli di non essere protetti dall'influenza dei fattori confondenti. Un'altra debolezza è che se l'esito viene stabilito in base al ricordo dei fatti (anziché su dati effettivamente registrati) la stima può essere distorta da ricordi errati.
Lo schema generale dello studio caso controllo è:
- arruolamento dei casi e dei controlli, tra loro appaiati;
- studio retrospettivo della frequenza dell'esposizione in entrambi i gruppi;
- confronto delle due frequenze attraverso misure di differenza e rapporto.

Non essendo possibile la stima corretta e diretta dell'incidenza, viene usato l'odds ratio.


Studio descrittivo
Studio che descrive una situazione. Si differenzia da uno studio sperimentale in quanto non introduce cambiamenti nella condizione in analisi.


Studio di coorte (Cohort study)
Studio epidemiologico osservazionale, che segue nel tempo l'evoluzione di un gruppo di soggetti identificati chiaramente in base a determinate caratteristiche (detto coorte). La selezione dei gruppi di confronto è effettuata in funzione dell'esposizione (esposti/non esposti) dei soggetti della coorte a interventi o fattori specifici. Uno studio di coorte prospettico definisce il gruppo di partecipanti e lo segue nel tempo. Uno studio di coorte retrospettivo (o storico) identifica i soggetti da dati del passato e li studia dal periodo a cui risalgono i dati al presente.
Gli studi prospettici di coorte, oltre che essere eticamente accettabili, sono superiori a quelli retrospettivi (caso-controllo) perché meno soggetti ad "errori sistematici", in quanto essi non dipendono da dati raccolti in precedenza magari con modalità poco affidabili. Essi consentono un controllo almeno parziale dei fattori confondenti in quanto spesso permettono di fare un appaiamento tra il gruppo di pazienti esposti e quello dei non esposti (cioè una selezione dei pazienti esposti e non esposti paragonabili per sesso, età e altri fattori). Un altro punto a favore degli studi prospettici è che essi possono fornire una stima della incidenza della malattia.
Gli svantaggi principali dello studio di coorte sono di richiedere più tempo, in quanto si deve seguire la comparsa degli eventi, e di essere più costosi. Inoltre, esso non è applicabile a malattie rare per la difficoltà nel reperimento di un numero di casi sufficiente.


Studio longitudinale (Longitudinal study)
Indagine svolta rilevando più volte nel tempo il fenomeno oggetto della ricerca.
L'indagine longitudinale può essere "retrospettiva", ossia svolta rilevando ad una certa data informazioni su fenomeni del passato, o "prospettica", ossia svolta seguendo nel tempo la popolazione o le popolazioni oggetto di ricerca.


Studio osservazionale (Observational study)

Studio non-sperimentale in cui la condizione in studio viene osservata nel corso del tempo.


Studio prospettico (Prospective study)
Disegno di uno studio che valuta gli effetti di un intervento identificando i soggetti in base a una condizione di rischio o a un'esposizione presente al momento dell'inizio dello studio, e seguendole nel tempo per osservare gli esiti dell'intervento stesso. Uno studio clinico controllato e randomizzato, per esempio, ha sempre un disegno prospettico.


Studio retrospettivo (Retrospective study)
Disegno di uno studio in cui i risultati di un gruppo di soggetti sono esaminati dopo che si è verificato l'evento.


Studio sperimentale (Experimental study)
Studio in cui l'investigatore decide il tipo di esposizione o più in generale l'intervento terapeutico o di prevenzione a cui ogni individuo viene sottoposto. Gli individui vengono quindi seguiti per determinare l'effetto dell'esposizione o dell'intervento sul loro stato di salute e sull'insorgenza di eventi.


Studio trasversale (Cross-sectional study)
Studio analitico di prevalenza effettuato rilevando lo stato della popolazione in un certo istante temporale, o, al più, lungo un intervallo di tempo molto ridotto. Un esempio è rappresentato dal censimento della popolazione, indagine che si propone di "fotografare" la realtà di una popolazione statistica ad un determinato istante. Il termine inglese survey, quando non è diversamente indicato, indica un'indagine trasversale.


Systematic review (vai alla voce Revisione sistematica)

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Tabelle
Le tabelle costituiscono un sistema di rappresentazione dei dati esaustivo, ma non sempre di facile comprensione, specie se si analizza una variabile complessa.
Per variabili qualitative si usano
- tabelle di frequenza: per ciascuna modalità della variabile riportano la numerosità, la percentuale sul totale (o sul totale esclusi i casi mancanti) e la percentuale cumulata;


- tabelle di contingenza o cross-tables: riportano le frequenze congiunte di due (o più) variabili


Tasso (Rate)
Espressione aritmetica, solitamente in forma di percentuale, che misura la variazione di una grandezza nel tempo o la relazione tra due grandezze in un dato momento. (vedi anche Misure di frequenza)


Tasso d'attacco (Attack rate)
Un particolare tasso di incidenza che misura la frequenza di una malattia, di una condizione cronica o di un trauma, in una particolare popolazione ed in riferimento ad un limitato intervallo di tempo, ad esempio durante un'epidemia. Nel calcolo del tasso di attacco, il numeratore è costituito dal numero di nuovi casi del problema sanitario oggetto di studio nel corso dell'epidemia e il denominatore è la popolazione all'inizio del periodo. Il tasso di attacco trova applicazione quando il periodo di esposizione al determinante (o ai determinanti) di malattia è di durata limitata.


Tasso di eventi nel gruppo di controllo (Control event rate [CER])
Il rapporto tra il numero di pazienti che hanno manifestato l'evento nel gruppo di controllo e il totale dei controlli.


Tasso di eventi nel gruppo di esposizione (Exposition event rate [EER])
Il rapporto tra il numero di pazienti che hanno manifestato l'evento nel gruppo di esposizione e il totale degli esposti.


Tasso di incidenza (Incidence rate)
Densità con cui l'evento si verifica nella durata totale dell'osservazione. E' un tasso il cui numeratore è il numero di nuovi casi che si verificano nella popolazione in un certo intervallo di tempo, ed il denominatore è costituito dal tempo-persona in cui ciascun individuo della popolazione è a rischio nell'intervallo considerato. Permette di tener conto della possibilità che la popolazione a rischio vari durante l'intervallo di riferimento.


Tasso di letalità (Case-fatality rate)
Proporzione fra il numero di soggetti deceduti per una patologia e il numero di soggetti affetti da quella patologia in un determinato periodo di tempo.


Tasso di morbidità
Proporzione di soggetti malati in una popolazione definita in un determinato periodo di tempo. E' detto grezzo quando è calcolato su tutta la popolazione.


Tasso di mortalità
Proporzione fra il numero di soggetti deceduti e il numero di soggetti presenti in una popolazione definita in un determinato periodo di tempo.


Tasso di mortalità corretto per età (Age-adjusted mortality rate)
Tasso di mortalità
modificato statisticamente per tener conto dell'effetto delle diverse composizioni per età di differenti popolazioni oggetto di studio.


Tasso di mortalità età-specifico (Age-specific mortality rate)
Tasso di mortalità
relativo ad un particolare gruppo di età. Nel calcolo dei tassi di mortalità età specifici, il numeratore è il numero di morti tra gli individui di una certa fascia d'età, mentre il denominatore è il numero totale di individui della popolazione nella stessa fascia d'età.


Tasso di mortalità grezzo (Crude mortality rate)
Tasso di mortalità
di una popolazione per tutte le cause. Il tasso grezzo di mortalità esprime il tasso effettivamente osservato in una popolazione in un periodo, e rappresenta il parametro di base per misurare l'andamento della mortalità. Il tasso grezzo di mortalità si calcola convenzionalmente nel periodo di 1 anno; al denominatore della frazione si pone, sempre convenzionalmente, la popolazione esistente a metà anno. Come si è visto, il tasso grezzo si applica all'intera popolazione, senza specificare alcuna caratteristica (es. età) degli individui che la compongono. Nel caso di popolazioni eterogenee è consigliabile suddividere la popolazione in più sottogruppi omogenei rispetto a una o più caratteristiche (ad. esempio, sesso, età ecc.) e calcolare i tassi nell'ambito dei sottogruppi. In questo caso, i tassi vengono detti "tassi specifici".


Tasso di mortalità sesso-specifico (Sex-specific mortality rate)
Tasso di mortalità
calcolato tra i soli individui di sesso maschile o femminile.


Tasso di mortalità, causa-specifico (Cause-specific mortality rate)
Tasso di mortalità
per una certa causa. Nel calcolo dei tassi di mortalità causa-specifici, il numeratore è il numero delle morti attribuite ad una determinata causa durante un certo intervallo di tempo in una popolazione, mentre il denominatore è il numero totale di individui presenti nella popolazione a metà dell'intervallo di tempo considerato.


Tasso standardizzato
Tasso inerente ad un determinato fenomeno (natalità, mortalità etc.) risultante dalla mediazione di tassi specifici calcolati per singole modalità di una variabile della quale si vogliono rimuovere gli effetti con pesi dati da popolazioni-tipo. Il confronto dei tassi standardizzati di diverse categorie di popolazione indica quali sarebbero i differenziali di rischio di morte delle popolazioni se queste avessero la stessa struttura per età.


Tempo-persona (Person-time)
Il numero totale di unità di tempo, settimane, mesi o anni in cui gli individui sono stati esposti ad una condizione o attivamente coinvolti in uno studio. Ad esempio, un anno-persona può rappresentare un singolo individuo che è stato esposto per un anno o due individui esposti ciascuno per sei mesi. In pratica ogni soggetto appartenente alla popolazione contribuisce al denominatore soltanto per il tempo in cui è stato effettivamente a rischio.


Tendenza
(vai alla voce Trend)


Trend
Cambiamenti o variazioni della frequenza di una malattia o di un attributo nel tempo.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Unità campionaria
Unità che compone un campione. Si distingue dall"unità di campionamento", con la quale si intende una delle unità che compongono un aggregato che deve essere sottoposto a campionamento.

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Valore abnorme
Valore estremo di un distribuzione che si caratterizza per essere anormale. E' talvolta indicato con il termine inglese outlier. Può trattarsi di un dato estremo effettivo oppure di un errore di registrazione. L'individuazione dei valori anomali è spesso preliminare alle elaborazioni statistiche a fini di analisi.


Variabile
Si definisce variabile in statistica ogni osservazione che può assumere diversi valori per differenti soggetti, tempi, luoghi, specie. E' importante differenziare le variabili per tipo di scala di misura. Si distinguono in:
QUALITATIVE
- nominali o categoriche
- ordinali o semiquantitative
QUANTITATIVE
- discrete
- continue


Variabile confondente
(vai alla voce Fattore confondente)


Variabile continua
Variabile di tipo numerico caratterizzata dall'avere un numero infinito di valori possibili tra due valori. Per esempio, i livelli di colesterolo, la massa corporea, la temperatura, l'età, l'altezza e il peso.


Variabile dicotomica
Variabile categorica che ammette solo due valori. Per esempio: sì/no, vivo/morto.


Variabile dipendente
La variabile dipendente è quella che misuriamo per verificare la sua correlazione con la variabile indipendente.


Variabile discreta
Variabile che può assumere un numero finito, o al più numerabile, di valori; di solito trova la sua origine da una operazione di conteggio. Per esempio: numero di figli, numero di battiti cardiaci al minuto, numeri di giorni di ricovero in ospedale.


Variabile indipendente
In una ricerca, si definisce variabile indipendente quella che viene manipolata direttamente dallo sperimentatore, o in alternativa selezionata attraverso il metodo di campionamento. Per esempio, il fatto che i pazienti siano trattati con un farmaco o con placebo è un esempio di variabile indipendente manipolata direttamente dallo sperimentatore. In alternativa, se viene selezionato un campione di maschi da confrontare con un campione di femmine, il sesso è una variabile indipendente controllata indirettamente attraverso il sistema di campionamento.


Variabile nominale o categorica
Variabile di natura qualitativa che può assumere un numero finito di modalità e per la quale si possono solo fare confronti di uguaglianza. Esempi sono il sesso, il colore degli occhi, la professione, il gruppo sanguigno. Per facilitare l'elaborazione, si possono rappresentare le variabili categoriali con codici numerici, ad es. per il sesso 0= maschio, 1= femmina, senza per questo trasformarle in variabili quantitative.
Sono variabili per le quali non ha senso calcolare la media, ma solo la frequenza. Particolare variabile categorica è quella dicotomica.


Variabile ordinale o semiquantitativa
È una variabile categorica, i cui valori possono essere messi in ordine crescente o decrescente, ad es. le scale "sempre - la maggior parte delle volte - più o meno la metà delle volte - raramente - mai" oppure "sufficiente" "buono" "discreto" "ottimo". Una caratteristica dei dati ordinali è che essi, a differenza dei dati continui, possono non essere equispaziati.
In medicina i dati ordinali più frequentemente usati sono quelli che si riferiscono a stadi di malattia. Gli stadi identificano semplicemente una gravità crescente, cioè riflettono un "ordine".


Varianza (Variance)
La media degli scarti dalla media elevati al quadrato: per ciascun dato si calcola lo scarto dalla media (cioè la differenza tra il dato stesso e la media aritmetica di tutti i dati), lo si eleva al quadrato, si calcola la media dei valori così ottenuti.

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

Years of potential life lost (YPLL) (vai alla voce Anni potenziali di vita persi)

 

top A B C D E F G H I J K L M N O P Q R S T U V W X Y Z top

 

 

 

 

Iscrizione newsletter