Medidas de posição, tendência central e dispersão

2489
Alexander Pearson

As medidas de tendência central, dispersão e posição, são valores usados ​​para interpretar corretamente um conjunto de dados estatísticos. Estes podem ser trabalhados diretamente, uma vez que são obtidos no estudo estatístico, ou podem ser organizados em grupos de igual frequência, facilitando a análise..

As três medidas de tendência central mais conhecidas e algumas de suas propriedades. Fonte: F. Zapata.

Medidas de tendência central

Eles permitem saber em torno de quais valores os dados estatísticos estão agrupados.

Média aritmética

Também é conhecido como a média dos valores de uma variável e é obtido somando todos os valores e dividindo o resultado pelo número total de dados.

  • Média aritmética para dados desagrupados

Seja uma variável x da qual temos n dados sem organizar ou agrupar, sua média aritmética é calculada da seguinte forma:

E em notação de soma:

Exemplo

Os proprietários de uma pousada turística de montanha têm a intenção de saber quantos dias em média os visitantes ficam nas instalações. Para isso, foi mantido um registro dos dias de permanência de 20 grupos de turistas, obtendo-se os seguintes dados:

1; 1; dois; dois; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; dois; dois; 3; 4; 1

O número médio de dias que os turistas ficam é:

  • Média aritmética para dados agrupados

Se os dados da variável são organizados em uma tabela de frequências absolutas feu e os centros de aula são x1, xdois,..., xn, a média é calculada por:

Em notação de soma:

Mediana

A mediana de um grupo de n valores da variável x é o valor central do grupo, desde que os valores sejam ordenados em ordem crescente. Desta forma, metade de todos os valores são menores que a moda e a outra metade são maiores..

  • Mediana de dados desagrupados

Os seguintes casos podem ocorrer:

-Número n de valores da variável x  chance: a mediana é o valor que está bem no meio do grupo de valores:

-Número n de valores da variável x par: neste caso, a mediana é calculada como a média dos dois valores centrais do grupo de dados:

Exemplo

Para encontrar a mediana dos dados do albergue turístico, eles são ordenados primeiro do menor para o maior:

1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5

O número de dados é par, portanto, existem dois dados centrais: X10 e Xonze e uma vez que ambos valem 2, sua média também é.

Mediana = 2

  • Mediana de dados agrupados

A seguinte fórmula é usada:

Os símbolos na fórmula significam:

-c: largura do intervalo que contém a mediana

-BM: limite inferior do mesmo intervalo

-Fm: número de observações contidas no intervalo a que pertence a mediana.

-n: dados totais.

-FBM: número de observações antes do intervalo contendo a mediana.

moda

O modo para dados desagrupados é o valor com a frequência mais alta, enquanto para dados agrupados é a classe com a frequência mais alta. Moda é considerada o dado ou classe mais representativa da distribuição.

Duas características importantes dessa medida é que um conjunto de dados pode ter mais de um modo, e o modo pode ser determinado para dados quantitativos e qualitativos..

Exemplo

Continuando com os dados do parador turístico, o que mais se repete é 1, portanto, o mais usual é que os turistas fiquem 1 dia no parador.

Medidas de dispersão

As medidas de dispersão descrevem como os dados estão agrupados em torno das medidas centrais.

Classificação

É calculado subtraindo os maiores dados e os menores dados. Se essa diferença for grande, é um sinal de que os dados estão dispersos, enquanto valores pequenos indicam que os dados estão próximos da média..

Exemplo

O intervalo para os dados do parador turístico é:

Intervalo = 5−1 = 4

Variância

  • Variância para dados desagrupados

Para encontrar a variância sdois É necessário primeiro saber a média aritmética, então a diferença quadrática entre cada dado e a média é calculada, todos eles são somados e divididos pelo número total de observações. Essas diferenças são conhecidas como desvios.

A variância, que é sempre positiva (ou zero), indica a que distância as observações estão da média: se a variância é alta, os valores são mais dispersos do que quando a variância é pequena.

Exemplo

A variação dos dados do albergue turístico é:

1; 1; dois; dois; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; dois; dois; 3; 4; 1

  • Variância para dados agrupados

Para encontrar a variância de um conjunto de dados agrupados, é necessário o seguinte: i) a média, ii) a frequência feu  que é o total de dados em cada classe e iii) xeu  ou valor de classe:

La desviación estándar es la raíz cuadrada positiva de la varianza, por lo que tiene una ventaja sobre la varianza: viene en las mismas unidades que la variable bajo estudio y así se tiene una idea más directa de lo cerca o lejos que está la variable de a média.

  • Desvio padrão para dados desagrupados

É determinado simplesmente encontrando a raiz quadrada da variância para dados desagrupados:

O desvio padrão para os dados do albergue turístico é:

s = √ (sdois) = √1,95 = 1,40

  • Desvio padrão para dados agrupados

É calculado encontrando a raiz quadrada da variância para dados agrupados:

Medidas de posição

As medidas de posição dividem um conjunto ordenado de dados em partes de tamanhos iguais. A mediana, além de ser uma medida de tendência central, é também uma medida de posição, pois divide o todo em duas partes iguais. Mas partes menores podem ser obtidas com quartis, decis e percentis.

Quartis

Os quartis dividem o conjunto em quatro partes iguais, cada uma contendo 25% dos dados. Eles são denotados como Q1, Qdois e que3 e a mediana é o quartil Qdois. Desta forma, 25% dos dados estão abaixo do Q quartil.1, 50% abaixo do quartil Qdois ou mediana e 75% abaixo do quartil Q3.

Figura 2. Os quartis dividem o conjunto de dados em quatro partes iguais. Fonte: F. Zapata.
  • Quartis para dados desagrupados

Os dados são ordenados e o total é dividido em 4 grupos com o mesmo número de dados cada. A posição do primeiro quartil é encontrada por:

Q1 = (n + 1) / 4

Onde n são os dados totais. Se o resultado for um inteiro, os dados correspondentes a essa posição são localizados, mas se for decimal, os dados correspondentes à parte inteira são calculados em média com o próximo, ou para maior precisão são interpolados linearmente entre os referidos dados.

Exemplo

A posição do primeiro quartil Q1 para os dados do parador turístico é:

Q1 = (n + 1) / 4 = (20 + 1) / 4 = 5,25

Esta é a posição do quartil 1 e como o resultado é decimal, os dados X são pesquisados5 e X6, que são respectivamente X5 = 1 e X6 = 1 e a média é calculada, resultando em:

Primeiro quartil = 1

1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5.

A posição do segundo quartil Qdois isso é:

Qdois = 2 (n + 1) / 4 = 10,5

Qual é a média entre X10 e Xonze e corresponde à mediana:

Segundo quartil = Mediana = 2

A posição do terceiro quartil é calculada por:

Q3 = 3 (n + 1) / 4 = 3 (20 + 1) / 4 = 15,75

Também é decimal, portanto, X é a médiaquinze e X16:

1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5.

Mas, uma vez que ambos valem 4:

Terceiro quartil = 4

A fórmula geral para a posição dos quartis em dados desagrupados é:

Qk = k (n + 1) / 4

Com k = 1,2,3.

  • Quartis para dados agrupados

Eles são calculados de forma semelhante à mediana:

A explicação dos símbolos é:

-BQ: limite inferior do intervalo contendo o quartil

-c: largura desse intervalo

-Fo que: número de observações contidas no intervalo quartil.

-n: dados totais.

-FBQ: número de dados antes do intervalo contendo o quartil.

Decis e percentis

Os decis e percentis dividem o conjunto de dados em 10 partes iguais e 100 partes iguais respectivamente, e seu cálculo é realizado de forma semelhante ao dos quartis.

  • Decis e percentis para dados desagrupados

As fórmulas são usadas respectivamente:

Dk = k (n + 1) / 10

Com k = 1,2,3… 9.

Decil Ddeve ser igual à mediana.

Pk = k (n + 1) / 100

Com k = 1,2,3 ... 99.

O percentil Pcinquenta deve ser igual à mediana.

Exemplo

No exemplo do albergue turístico, a posição do D3 isso é:

D3 = 3 (20 + 1) / 10 = 6,3

Uma vez que é um número decimal, X é a média6 e X7, ambos iguais a 1:

1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5

Isso significa que 3 décimos dos dados estão abaixo de X7 = 1 e os restantes acima.

  • Decis e percentis para dados agrupados

As fórmulas são análogas às dos quartis. D é usado para denotar decis e P para percentis, e os símbolos são interpretados da mesma forma:

A regra empírica

Quando os dados são distribuídos simetricamente e a distribuição é unimodal, existe uma regra chamada  Regra empírica ou regra 68 - 95 - 99, que os agrupa nos seguintes intervalos:

  • 68% dos dados estão no intervalo:

  • 95% dos dados estão no intervalo:

  • 99% dos dados estão no intervalo:

Exemplo

Em que intervalo está 95% dos dados do parador turístico?

Eles estão no intervalo: [2,5-1,40; 2,5 + 1,40] = [1,1; 3,9].

Referências

  1. Berenson, M. 1985. Statistics for management and economics. Interamericana S.A.
  2. Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
  3. Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
  4. Spiegel, M. 2009. Estatísticas. Schaum series. 4º Edição. Colina Mcgraw.
  5. Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.

Ainda sem comentários