Misure dell'andamento centrale per i dati raggruppati



il misure di tendenza centrale dei dati raggruppati Essi sono utilizzati in statistica per descrivere certi comportamenti di un gruppo di dati forniti, ad esempio quale valore sono vicini, che è la media dei dati raccolti, tra gli altri.

Quando viene prelevata una grande quantità di dati, è utile raggrupparli per avere un ordine migliore di essi e quindi essere in grado di calcolare determinate misure di tendenza centrale.

Tra le misure di tendenza centrale più utilizzate sono la media aritmetica, la mediana e la modalità. Questi numeri indicano alcune qualità dei dati raccolti in un determinato esperimento.

Per utilizzare queste misure è necessario prima sapere come raggruppare un insieme di dati.

Dati raggruppati

Per raggruppare i dati prima è necessario calcolare l'intervallo dei dati, che viene ottenuto sottraendo il valore più alto meno il valore più basso dei dati.

Quindi scegliere un numero "k", che è il numero di classi in cui si desidera raggruppare i dati.

Procediamo a dividere l'intervallo tra "k" per ottenere l'ampiezza delle classi da raggruppare. Questo numero è C = R / k.

Infine, viene avviato il raggruppamento, per il quale viene scelto un numero inferiore rispetto al valore più basso dei dati ottenuti.

Questo numero sarà il limite inferiore della prima classe. A questo viene aggiunto C. Il valore ottenuto sarà il limite superiore della prima classe.

Quindi, C viene aggiunto a questo valore e viene ottenuto il limite superiore della seconda classe. In questo modo procediamo fino ad ottenere il limite superiore dell'ultima classe.

Dopo aver raggruppato i dati, è possibile calcolare la media, la mediana e la modalità.

Per illustrare come vengono calcolati la media aritmetica, la mediana e la modalità, procederemo con un esempio.

esempio

Raggruppa i seguenti dati in 4 classi.Nel calcolare l'intervallo si ottiene che questo è R = 9-1 = 8. L'ampiezza delle classi è C = R / k = 8/4 = 2.

Pertanto, quando si raggruppano i dati si otterrà una tabella come la seguente:

Le 3 principali misure di tendenza centrale

Ora procederemo a calcolare la media aritmetica, la mediana e la modalità. L'esempio precedente verrà utilizzato per illustrare questa procedura.

1- Media aritmetica

La media aritmetica consiste nel moltiplicare ogni frequenza per la media dell'intervallo. Quindi vengono aggiunti tutti questi risultati e infine viene diviso tra i dati totali.

Usando l'esempio precedente si otterrebbe che la media aritmetica è uguale a:

(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111

Ciò indica che il valore medio dei dati nella tabella è 5.11111.

2- Medio

Per calcolare la mediana di un set di dati, tutti i dati vengono ordinati per la prima volta dal meno al più grande. Si possono presentare due casi:

- Se il numero di dati è dispari, la mediana è il dato giusto al centro.

- Se il numero di dati è pari, la mediana è la media dei due dati che rimangono al centro.

Quando si tratta di dati raggruppati, il calcolo della mediana viene effettuato nel modo seguente:

- N / 2 è calcolato, dove N è il totale dei dati.

- il primo intervallo in cui la frequenza cumulativa (frequenza somma) è maggiore di N / 2 è richiesta, e viene selezionato il limite inferiore di questo intervallo, denominato Li.

La mediana è data dalla seguente formula:

Me = Li + (Ls-Li) * (N / 2 - Frequenza accumulata prima di Li) / Frequenza di [Li, Ls)

Ls è il limite superiore dell'intervallo sopra menzionato.

Se si utilizza la tabella dei dati sopra deve N / 2 = 18/2 = 9. frequenze cumulativi sono 4, 8, 14 e 18 (uno per ogni riga della tabella).

Pertanto, il terzo intervallo dovrebbe essere selezionato, poiché la frequenza accumulata è maggiore di N / 2 = 9.

Quindi Li = 5 e Ls = 7. Applicando la formula sopra descritta, devi:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5.3333.

3- Moda

La moda è il valore che ha la maggiore frequenza tra tutti i dati raggruppati; cioè, è il valore che viene ripetuto più volte nel set di dati iniziale.

Quando si dispone di una grande quantità di dati, la seguente formula viene utilizzata per calcolare la modalità dei dati raggruppati:

Mo = Li + (Ls-Li) * (frequenza Li - Frequenza L (i-1)) / ((frequenza Li - Frequenza L (i-1)) + (frequenza Li - Frequenza L ( i + 1)))

L'intervallo [Li, Ls) è l'intervallo in cui viene trovata la frequenza più alta. Per l'esempio fatto in questo articolo abbiamo che la moda è data da:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.

Un'altra formula che viene utilizzata per ottenere un valore approssimativo alla moda è la seguente:

Mo = Li + (Li-Ls) * (frequenza L (i + 1)) / (frequenza L (i-1) frequenza L (i + 1)).

Con questa formula, i conti sono i seguenti:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

riferimenti

  1. Bellhouse, D. R. (2011). Abraham De Moivre: preparare il palcoscenico per la probabilità classica e le sue applicazioni. Stampa CRC.
  2. Cifuentes, J. F. (2002). Introduzione alla teoria della probabilità. Univ. National of Colombia.
  3. Daston, L. (1995). Probabilità classica nell'Illuminismo. Princeton University Press.
  4. Larson, H. J. (1978). Introduzione alla teoria delle probabilità e dell'inferenza statistica. Editoriale Limusa.
  5. Martel, P.J., & Vegas, F. J. (1996). Probabilità e statistica matematica: applicazioni nella pratica clinica e nella gestione della salute. Ediciones Díaz de Santos.
  6. Vázquez, A. L., & Ortiz, F. J. (2005). Metodi statistici per misurare, descrivere e controllare la variabilità. Ed. Università della Cantabria.
  7. Vázquez, S. G. (2009). Manuale di matematica per l'accesso all'Università. Centro Editoriale di Studi Ramon Areces SA.