Gli statistici utilizzano una varietà di calcoli quando raccolgono e interpretano i dati dei loro studi. Three sigma può aiutare a determinare se esistono valori anomali in un set di dati durante la valutazione delle variabili raccolte. Sapere come calcolare tre sigma può aiutarti a impostare i limiti di controllo nei tuoi set di dati. In questo articolo, esploriamo cosa sono i tre sigma nelle statistiche, confrontiamo questo calcolo con sei sigma, condividiamo i passaggi per il calcolo di tre sigma e forniamo un esempio.
Cos’è il three sigma nelle statistiche?
Three sigma in statistica è un calcolo che ha dati in tre deviazioni standard da una media. Noto anche come i limiti dei tre sigma o regola empirica, questo strumento aiuta a calcolare la probabilità di un insieme di dati. Three sigma segue la regola 68-95-99.7, con il 68% dei dati all’interno di una deviazione standard della media, il 95% dei dati entro due deviazioni standard della media e il 99,7% dei dati entro tre deviazioni standard della media.
Tre sigma contro sei sigma
Ecco alcune differenze tra tre sigma e sei sigma:
Accuratezza
Poiché sei sigma calcola sei deviazioni standard dalla media, il suo valore tende ad essere più accurato di tre sigma. Un calcolo six sigma ha una precisione del 99,99966%, mentre un calcolo a tre sigma ha una precisione del 99,73%. Mentre la differenza tra questi due calcoli è inferiore allo 0,25%, quest’area di errore può avere grandi effetti su alcuni settori, come quello manifatturiero, bancario e informatico, dove l’accuratezza è vitale. Quando si esaminano i dati per questi tipi di settori, i professionisti possono scegliere di calcolare sei sigma anziché tre sigma, poiché riduce il margine di errore.
Numero di passaggi
Sei sigma comporta più passaggi di tre sigma. Questo perché calcola tre deviazioni standard aggiuntive rispetto a tre sigma. Poiché sei sigma comporta più passaggi, ci sono più possibilità che si verifichino errori durante i calcoli. Tuttavia, se calcolato correttamente, fornisce un set di dati più accurato.
A cosa servono i calcoli three sigma?
Gli statistici possono utilizzare calcoli a tre sigma per impostare i limiti di controllo superiore e inferiore nei grafici statistici di controllo della qualità, che creano limiti per i processi aziendali o di produzione. Ciò consente agli statistici di identificare eventuali valori anomali nei loro dati in modo da poter regolare i loro dati di conseguenza quando i loro ambienti ben controllati non tengono conto di determinati risultati. Ad esempio, durante una sperimentazione medica, se la maggior parte dei partecipanti sperimenta un miglioramento positivo delle loro condizioni in una certa misura, ma due pazienti sperimentano un miglioramento quasi doppio delle loro condizioni, allora potrebbe essere dovuto a fattori oltre il farmaco.
Come calcolare tre sigma
Utilizzare questi passaggi quando si calcola tre sigma:
1. Trova il mezzo
Per calcolare tre sigma, trova prima la media del tuo set di dati. Puoi farlo sommando tutte le tue variabili e quindi dividendole per il numero di variabili che hai. Ad esempio, se il set di dati include 7.2, 7.5, 7.8, 8.1, 8.3, 8.6, 8.8 e 9.2, è necessario aggiungere tali variabili per ottenere 65.5. È quindi possibile dividere 65,5 per otto, il numero di variabili nel set di dati, per ottenere 8,1875 (65,5 / 8 = 8,1875).
2. Calcola la varianza
Dopo aver trovato la media, trova la varianza o lo spread tra i punti dati. Questa è la somma dei quadrati trovati sottraendo la media da ogni variabile nel set di dati e quadrando la differenza. Per l’esempio precedente, è possibile iniziare sottraendo 8,1875 da 7,2 per ottenere -0,9875. Quindi si quadra 0,9875 per ottenere 0,97516. Continuare questi calcoli per tutte le variabili nel set di dati.
Una volta ottenuto il valore per tutti i quadrati variabili, è possibile sommarli e dividerli per il numero di variabili (8). Nell’esempio, la somma di tutti i quadrati variabili è 0,45553571. Quando si calcola la varianza, prendere in considerazione l’utilizzo di un calcolatore di varianza online per garantire l’accuratezza.
3. Individuare la deviazione standard
Quindi, calcola la radice quadrata della varianza per trovare la deviazione standard. Come con la varianza, puoi usare una calcolatrice per aiutarti a trovare questo valore. Nel nostro esempio, la deviazione standard è 0,67493386 (√0,45553571).
4. Scopri i tre sigma
Infine, calcola la tua fascia alta a tre sigma moltiplicando la deviazione standard per tre. Quindi aggiungere il valore alla media. Nell’esempio precedente, la fascia alta è 10,2123016 (0,67493386 x 3 = 2,02480158 + 8,1875 = 10,2123016).
Per la fascia bassa dei dati, moltiplicare la deviazione standard per tre e sottrarre la media. Nell’esempio, la nostra fascia bassa è -6,16269842 (0,67493386 x 3 = 2,02480158 – 8,1875 = -6,16269842). Ciò significa che tutti i dati inferiori a -6,16269842 o superiori a 10,2123016 sono considerati al di fuori del normale intervallo di dati.
Esempio di tre sigma
Ecco un esempio di tre sigma:
Samantha sta esaminando i dati di un recente studio sulle prestazioni dei dipendenti di Brett and Steven, Inc. Il suo set di dati include le seguenti variabili, che rappresentano la percentuale di errore che ogni dipendente ha su base settimanale: 1,5, 1,8, 2,1, 2,2, 2,4, 2,7 e 2,8. Per trovare i tre sigma per i suoi dati, calcola prima la media del set di dati sommando tutte le variabili e dividendole per sette, il numero di partecipanti. La media che calcola è 2,21428571 (1,5 + 1,8 + 2,1 + 2,2 + 2,4 + 2,7 + 2,8 = 15,5/7 = 2,21428571).
Successivamente, Samantha calcola la varianza del suo set di dati sottraendo la media da ciascuna variabile e quadrando la differenza, ad esempio (1,5 – 2,21428571 = -0,71428571; al quadrato = -0,51020408). Dopo aver eseguito questa operazione per ogni variabile, ottiene una varianza di 0,21809524. Dopo aver trovato la varianza, calcola la radice quadrata per ottenere la deviazione standard di 0,46700668.
Infine, Samantha trova i suoi tre sigma moltiplicando la deviazione standard per tre e aggiungendo la media per la fascia alta e sottraendo la media per la fascia bassa. La fascia alta di Samantha è 3,61530575 (0,46700668 x 3 = 1,40102004 + 2,21428571 = 3,61530575) e la fascia bassa è -0,81326567 (0,46700668 x 3 = 1,40102004 – 2,21428571 = -0,81326567). Ciò significa che quelli nel suo studio sulle prestazioni dei dipendenti che avevano una percentuale di errore superiore a -0,81326567 o superiore a 3,61530575 erano al di fuori del suo intervallo normale.
Concetti correlati in statistica
Di seguito sono riportati alcuni concetti statistici simili:
-
Sigma: Spesso rappresentato da questo simbolo Σ, sigma è la media media di una somma di dati.
-
Barra X: La barra X, rappresentata con il simbolo x̄, è un tipo di grafico di controllo utilizzato per mostrare la media campionaria di un insieme di dati.
-
Grafico R: Un grafico r è un grafico di controllo utilizzato dagli statistici per monitorare la deviazione standard del processo di un set di dati.
-
Deviazione standard: La deviazione standard, rappresentata dal simbolo greco σ, è la misura della variazione in un insieme di valori relativi alla sua media.