As medidas de tendência central, dispersão e posição, são valores usados para interpretar corretamente um conjunto de dados estatísticos. Estes podem ser trabalhados diretamente, uma vez que são obtidos no estudo estatístico, ou podem ser organizados em grupos de igual frequência, facilitando a análise..
Eles permitem saber em torno de quais valores os dados estatísticos estão agrupados.
Também é conhecido como a média dos valores de uma variável e é obtido somando todos os valores e dividindo o resultado pelo número total de dados.
Seja uma variável x da qual temos n dados sem organizar ou agrupar, sua média aritmética é calculada da seguinte forma:
E em notação de soma:
Os proprietários de uma pousada turística de montanha têm a intenção de saber quantos dias em média os visitantes ficam nas instalações. Para isso, foi mantido um registro dos dias de permanência de 20 grupos de turistas, obtendo-se os seguintes dados:
1; 1; dois; dois; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; dois; dois; 3; 4; 1
O número médio de dias que os turistas ficam é:
Se os dados da variável são organizados em uma tabela de frequências absolutas feu e os centros de aula são x1, xdois,..., xn, a média é calculada por:
Em notação de soma:
A mediana de um grupo de n valores da variável x é o valor central do grupo, desde que os valores sejam ordenados em ordem crescente. Desta forma, metade de todos os valores são menores que a moda e a outra metade são maiores..
Os seguintes casos podem ocorrer:
-Número n de valores da variável x chance: a mediana é o valor que está bem no meio do grupo de valores:
-Número n de valores da variável x par: neste caso, a mediana é calculada como a média dos dois valores centrais do grupo de dados:
Para encontrar a mediana dos dados do albergue turístico, eles são ordenados primeiro do menor para o maior:
1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5
O número de dados é par, portanto, existem dois dados centrais: X10 e Xonze e uma vez que ambos valem 2, sua média também é.
Mediana = 2
A seguinte fórmula é usada:
Os símbolos na fórmula significam:
-c: largura do intervalo que contém a mediana
-BM: limite inferior do mesmo intervalo
-Fm: número de observações contidas no intervalo a que pertence a mediana.
-n: dados totais.
-FBM: número de observações antes do intervalo contendo a mediana.
O modo para dados desagrupados é o valor com a frequência mais alta, enquanto para dados agrupados é a classe com a frequência mais alta. Moda é considerada o dado ou classe mais representativa da distribuição.
Duas características importantes dessa medida é que um conjunto de dados pode ter mais de um modo, e o modo pode ser determinado para dados quantitativos e qualitativos..
Continuando com os dados do parador turístico, o que mais se repete é 1, portanto, o mais usual é que os turistas fiquem 1 dia no parador.
As medidas de dispersão descrevem como os dados estão agrupados em torno das medidas centrais.
É calculado subtraindo os maiores dados e os menores dados. Se essa diferença for grande, é um sinal de que os dados estão dispersos, enquanto valores pequenos indicam que os dados estão próximos da média..
O intervalo para os dados do parador turístico é:
Intervalo = 5−1 = 4
Para encontrar a variância sdois É necessário primeiro saber a média aritmética, então a diferença quadrática entre cada dado e a média é calculada, todos eles são somados e divididos pelo número total de observações. Essas diferenças são conhecidas como desvios.
A variância, que é sempre positiva (ou zero), indica a que distância as observações estão da média: se a variância é alta, os valores são mais dispersos do que quando a variância é pequena.
A variação dos dados do albergue turístico é:
1; 1; dois; dois; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; dois; dois; 3; 4; 1
Para encontrar a variância de um conjunto de dados agrupados, é necessário o seguinte: i) a média, ii) a frequência feu que é o total de dados em cada classe e iii) xeu ou valor de classe:
La desviación estándar es la raíz cuadrada positiva de la varianza, por lo que tiene una ventaja sobre la varianza: viene en las mismas unidades que la variable bajo estudio y así se tiene una idea más directa de lo cerca o lejos que está la variable de a média.
É determinado simplesmente encontrando a raiz quadrada da variância para dados desagrupados:
O desvio padrão para os dados do albergue turístico é:
s = √ (sdois) = √1,95 = 1,40
É calculado encontrando a raiz quadrada da variância para dados agrupados:
As medidas de posição dividem um conjunto ordenado de dados em partes de tamanhos iguais. A mediana, além de ser uma medida de tendência central, é também uma medida de posição, pois divide o todo em duas partes iguais. Mas partes menores podem ser obtidas com quartis, decis e percentis.
Os quartis dividem o conjunto em quatro partes iguais, cada uma contendo 25% dos dados. Eles são denotados como Q1, Qdois e que3 e a mediana é o quartil Qdois. Desta forma, 25% dos dados estão abaixo do Q quartil.1, 50% abaixo do quartil Qdois ou mediana e 75% abaixo do quartil Q3.
Os dados são ordenados e o total é dividido em 4 grupos com o mesmo número de dados cada. A posição do primeiro quartil é encontrada por:
Q1 = (n + 1) / 4
Onde n são os dados totais. Se o resultado for um inteiro, os dados correspondentes a essa posição são localizados, mas se for decimal, os dados correspondentes à parte inteira são calculados em média com o próximo, ou para maior precisão são interpolados linearmente entre os referidos dados.
A posição do primeiro quartil Q1 para os dados do parador turístico é:
Q1 = (n + 1) / 4 = (20 + 1) / 4 = 5,25
Esta é a posição do quartil 1 e como o resultado é decimal, os dados X são pesquisados5 e X6, que são respectivamente X5 = 1 e X6 = 1 e a média é calculada, resultando em:
Primeiro quartil = 1
1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5.
A posição do segundo quartil Qdois isso é:
Qdois = 2 (n + 1) / 4 = 10,5
Qual é a média entre X10 e Xonze e corresponde à mediana:
Segundo quartil = Mediana = 2
A posição do terceiro quartil é calculada por:
Q3 = 3 (n + 1) / 4 = 3 (20 + 1) / 4 = 15,75
Também é decimal, portanto, X é a médiaquinze e X16:
1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5.
Mas, uma vez que ambos valem 4:
Terceiro quartil = 4
A fórmula geral para a posição dos quartis em dados desagrupados é:
Qk = k (n + 1) / 4
Com k = 1,2,3.
Eles são calculados de forma semelhante à mediana:
A explicação dos símbolos é:
-BQ: limite inferior do intervalo contendo o quartil
-c: largura desse intervalo
-Fo que: número de observações contidas no intervalo quartil.
-n: dados totais.
-FBQ: número de dados antes do intervalo contendo o quartil.
Os decis e percentis dividem o conjunto de dados em 10 partes iguais e 100 partes iguais respectivamente, e seu cálculo é realizado de forma semelhante ao dos quartis.
As fórmulas são usadas respectivamente:
Dk = k (n + 1) / 10
Com k = 1,2,3… 9.
Decil D5 deve ser igual à mediana.
Pk = k (n + 1) / 100
Com k = 1,2,3 ... 99.
O percentil Pcinquenta deve ser igual à mediana.
No exemplo do albergue turístico, a posição do D3 isso é:
D3 = 3 (20 + 1) / 10 = 6,3
Uma vez que é um número decimal, X é a média6 e X7, ambos iguais a 1:
1; 1; 1; 1; 1; 1; 1; dois; dois; dois; dois; 3; 3; 3; 4; 4; 4; 4; 5; 5
Isso significa que 3 décimos dos dados estão abaixo de X7 = 1 e os restantes acima.
As fórmulas são análogas às dos quartis. D é usado para denotar decis e P para percentis, e os símbolos são interpretados da mesma forma:
Quando os dados são distribuídos simetricamente e a distribuição é unimodal, existe uma regra chamada Regra empírica ou regra 68 - 95 - 99, que os agrupa nos seguintes intervalos:
Em que intervalo está 95% dos dados do parador turístico?
Eles estão no intervalo: [2,5-1,40; 2,5 + 1,40] = [1,1; 3,9].
Ainda sem comentários