Marchio di classe per ciò che serve, come viene preso ed esempi



il marchio di classe, noto anche come il punto medio, è il valore che si trova al centro di una classe, che rappresenta tutti i valori presenti in quella categoria. Fondamentalmente, il segno di classe viene utilizzato per il calcolo di alcuni parametri, come la media aritmetica o la deviazione standard.

Quindi, il segno di classe è il punto medio di qualsiasi intervallo. Questo valore è anche molto utile per trovare la varianza di un insieme di dati già raggruppati in classi, che a sua volta ci permette di capire quanto lontano dal centro questi dati determinati trovano.

indice

  • 1 distribuzione di frequenza
    • 1.1 Quante classi prendere in considerazione?
  • 2 Come hai capito?
    • 2.1 Esempio
  • 3 A cosa serve?
    • 3.1 Esempio
  • 4 riferimenti

Distribuzione di frequenza

Per capire cos'è una marca di classi, è necessario il concetto di distribuzione di frequenza. Dato un set di dati, una distribuzione di frequenza è una tabella che divide tali dati in un certo numero di categorie chiamate classi.

Questa tabella mostra qual è il numero di elementi che appartengono a ciascuna classe; quest'ultimo è noto come frequenza.

In questa tabella viene sacrificata parte delle informazioni ottenute dai dati, poiché invece di avere il valore individuale di ciascun elemento, sappiamo solo che appartiene a quella classe.

D'altra parte, otteniamo una migliore comprensione del set di dati, dal momento che in questo modo è più facile apprezzare modelli stabiliti, che facilitano la manipolazione di tali dati.

Quante classi prendere in considerazione?

Per fare una distribuzione di frequenza dobbiamo prima determinare il numero di classi che vogliamo prendere e scegliere i limiti di classe di esse.

La scelta di quante classi prendere dovrebbe essere conveniente, tenendo conto che un piccolo numero di classi può nascondere informazioni sui dati che vogliamo studiare e una molto grande può generare troppi dettagli che non sono necessariamente utili.

I fattori che dobbiamo prendere in considerazione quando scegliamo quante classi prendere sono molti, ma tra questi due spiccano: il primo è quello di prendere in considerazione la quantità di dati che dobbiamo considerare; il secondo è sapere quale dimensione è l'intervallo della distribuzione (cioè la differenza tra l'osservazione più grande e quella più piccola).

Dopo aver definito le classi, continuiamo a contare quanti dati esistono in ogni classe. Questo numero è chiamato frequenza di classe ed è denotato da fi.

Come abbiamo detto in precedenza, abbiamo una distribuzione di frequenza che perde le informazioni che provengono individualmente da ogni dato o osservazione. Pertanto, si cerca un valore che rappresenti l'intera classe a cui appartiene; questo valore è il marchio di classe.

Come hai capito?

Il segno di classe è il valore centrale rappresentato da una classe. Si ottiene aggiungendo i limiti dell'intervallo e dividendo questo valore per due. Questo potremmo esprimere matematicamente come segue:

xio= (Limite inferiore + limite superiore) / 2.

In questa espressione xio denota il marchio della classe ith.

esempio

Dato il seguente set di dati, fornire una distribuzione di frequenza rappresentativa e ottenere il codice di classe corrispondente.

Poiché i dati con il valore numerico più alto sono 391 e il più piccolo è 221, abbiamo che l'intervallo è 391 -221 = 170.

Sceglieremo 5 classi, tutte con le stesse dimensioni. Un modo per scegliere le classi è il seguente:

Si noti che ogni dato è in una classe, sono disgiunti e hanno lo stesso valore. Un altro modo per scegliere le classi è considerare i dati come parte di una variabile continua, che potrebbe raggiungere qualsiasi valore reale. In questo caso possiamo considerare le classi del modulo:

205-245, 245-285, 285-325, 325-365, 365-405

Tuttavia, questo modo di raggruppare i dati può presentare alcune ambiguità con i confini. Ad esempio, nel caso del 245 sorge la domanda: a quale classe appartiene, al primo o al secondo?

Per evitare queste confusioni, viene fatta una convenzione di punti estremi. In questo modo, la prima classe sarà l'intervallo (205.245), il secondo (245.285) e così via.

Una volta definite le classi, procediamo a calcolare la frequenza e abbiamo la seguente tabella:

Dopo aver ottenuto la distribuzione di frequenza dei dati, procediamo a trovare i segni di classe di ciascun intervallo. In effetti, dobbiamo:

x1=(205+ 245)/2=225

x2=(245+ 285)/2=265          

x3=(285+ 325)/2=305

x4=(325+ 365)/2=345

x5=(365+ 405)/2=385

Possiamo rappresentarlo con il seguente grafico:

A cosa serve?

Come accennato in precedenza, il segno di classe è molto funzionale per trovare la media aritmetica e la varianza di un gruppo di dati che è già stato raggruppato in classi diverse.

Possiamo definire la media aritmetica come la somma delle osservazioni ottenute tra la dimensione del campione. Da un punto di vista fisico, la sua interpretazione è come il punto di equilibrio di un set di dati.

Identificare un intero insieme di dati con un singolo numero può essere rischioso, quindi dobbiamo anche tener conto della differenza tra questo punto di equilibrio e i dati reali. Questi valori sono noti come deviazioni dalla media aritmetica e questi sono usati per determinare quanto varia la media aritmetica dei dati.

Il modo più comune per trovare questo valore è la varianza, che è la media dei quadrati delle deviazioni dalla media aritmetica.

Per calcolare la media aritmetica e la varianza di un insieme di dati raggruppati in una classe, utilizziamo le seguenti formule, rispettivamente:

In queste espressioni xio è il marchio di classe i-th, fio rappresenta la frequenza corrispondente e k il numero di classi in cui sono stati raggruppati i dati.

esempio

Facendo uso dei dati forniti nell'esempio precedente, possiamo espandere un po 'di più i dati della tabella di distribuzione delle frequenze. Hai ottenuto quanto segue:

Quindi, quando si sostituiscono i dati nella formula, abbiamo lasciato che la media aritmetica è:

La sua varianza e deviazione standard sono:

Da ciò possiamo concludere che i dati originali hanno una media aritmetica di 306,6 e una deviazione standard di 39,56.

riferimenti

  1. Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Statistica descrittiva. Editoriale di Esic.
  2. Jhonson Richard A.Miller e Freund Probability and Statesmen per Ingenieros.Pearson Educacion.
  3. Miller I & Freund J. Probability and Statesmen for Engineers. REVERTE.
  4. Sarabia A. Jose Maria, Pascual Marta. Corso base di statistica per le aziende
  5. Llinás S. Humberto, Rojas A. Carlos Statistica descrittiva e distribuzioni di probabilità.Universidad del Norte Editorial