Medidas de tendência central para fórmulas de dados agrupados, exercícios

3246
Anthony Golden
Medidas de tendência central para fórmulas de dados agrupados, exercícios

As medidas de tendência central eles indicam o valor em torno do qual estão os dados de uma distribuição. A mais conhecida é a média ou média aritmética, que consiste em somar todos os valores e dividir o resultado pelo número total de dados.

No entanto, se a distribuição consiste em um grande número de valores e eles não são apresentados de forma ordenada, não é fácil realizar os cálculos necessários para extrair as informações valiosas que eles contêm..

Figura 1. Medidas de tendência central para dados agrupados são uma boa indicação do comportamento geral dos dados

É por isso que eles são agrupados em classes ou categorias, para desenvolver um distribuição de frequências. Fazendo essa ordenação prévia dos dados, fica mais fácil calcular as medidas de tendência central, entre as quais:

-Metade

-Mediana

-moda

-Média geométrica

-Média harmônica

Fórmulas

Aqui estão as fórmulas para as medidas de tendência central para os dados agrupados:

Média aritmética

A média é a mais utilizada para caracterizar dados quantitativos (valores numéricos), embora seja bastante sensível aos valores extremos da distribuição. É calculado por:

Com:

-X: média ou média aritmética

-Feu: frequência de aula

-meu: a marca da classe

-g: número de aulas

-n: dados totais

Mediana

Para calculá-lo, é necessário encontrar o intervalo que contém a observação n / 2 e interpolar para determinar o valor numérico da referida observação, utilizando a seguinte fórmula:

Onde:

-c: largura do intervalo a que pertence a mediana

-BM: limite inferior do referido intervalo

-Fm: número de observações contidas no intervalo

-n / 2: dados totais divididos por 2.

-FBM: número de observações antes do intervalo contendo a mediana.

Portanto, a mediana é uma medida de posição, ou seja, divide o conjunto de dados em duas partes. Eles também podem ser definidos quartis, decis Y percentis, que dividem a distribuição em quatro, dez e cem partes, respectivamente.

moda

Nos dados agrupados, a classe ou categoria que contém a maioria das observações é pesquisada. Esta é a classe modal. Uma distribuição pode ter dois ou mais modos, caso em que é chamada bimodal Y multimodal, respectivamente.

Você também pode calcular o modo em dados agrupados seguindo a equação:

Com:

-eu1: limite inferior da classe onde o modo se encontra

1: subtraia entre a frequência da classe modal e a frequência da classe que a precede.

dois: subtraia entre a frequência da classe modal e a frequência da próxima classe.

-c: largura do intervalo contendo o modo

Média harmônica

A média harmônica é denotada por H. Quando você tem um conjunto de n valores x1, xdois, x3..., A média harmônica é o inverso ou recíproco da média aritmética dos inversos dos valores.

É mais fácil ver através da fórmula:

E tendo os dados agrupados disponíveis, a expressão torna-se:

Onde:

-H: média harmônica

-Feu: frequência de aula

-meu: marca de classe

-g: número de aulas

-N = f1 + Fdois + F3 +...

Média geométrica

Se eles têm n números positivos x1, xdois, x3…, Sua média geométrica G é calculada pela enésima raiz do produto de todos os números:

No caso de dados agrupados, pode-se mostrar que o logaritmo decimal da média geométrica log G é dado por:

Onde:

-G: média geométrica

-Feu: frequência de aula

-meu: a marca da classe

-g: número de aulas

-N = f1 + Fdois + F3 +...

Relação entre H, G e X

É sempre verdade que:

H ≤ G ≤ X

Definições mais usadas

As seguintes definições são necessárias para encontrar os valores descritos nas fórmulas acima:

Frequência

A frequência é definida como o número de vezes que um dado é repetido.

Classificação

É a diferença entre o maior e o menor valor, presente na distribuição.

Número de aulas

Para saber em quantas classes agrupamos os dados, usamos alguns critérios, por exemplo o seguinte:

Limites

Os valores extremos de cada classe ou intervalo são chamados limites e cada classe pode ter limites bem definidos, caso em que tem um limite inferior e um superior. Ou pode ter limites abertos, quando uma faixa é dada, por exemplo de valores maiores ou menores que um certo número.

Marca de classe

Ele simplesmente consiste no ponto médio do intervalo e é calculado pela média do limite superior e do limite inferior.

Largura da lacuna

Os dados podem ser agrupados em classes de tamanho igual ou diferente, ou seja, largura ou largura. A primeira opção é a mais utilizada, pois torna os cálculos muito mais fáceis, embora em alguns casos seja imprescindível que as classes tenham larguras diferentes.

A largura c O intervalo pode ser determinado pela seguinte fórmula:

c = Faixa / Nc

Ondec é o número de aulas.

Exercício resolvido

Abaixo temos uma série de medidas de velocidade em km / h, feitas com radar, que correspondem a 50 carros que passaram por uma rua de uma determinada cidade:

Figura 2. Tabela do exercício resolvido. Fonte: F. Zapata.

Solução

Os dados apresentados desta forma não são organizados, então o primeiro passo é agrupá-los em classes.

Etapas para agrupar os dados e construir a tabela

Passo 1

Encontre o intervalo R:

R = (52 - 16) km / h = 36 km / h

Passo 2

Selecione o número de classes Nc, de acordo com os critérios dados. Como existem 50 dados, podemos escolher Nc = 6.

etapa 3

Calcular largura c do intervalo:

c = Faixa / Nc = 36/6 = 6

Passo 4

Forme classes e dados de grupo da seguinte forma: para a primeira classe, um valor ligeiramente menor que o menor valor presente na tabela é escolhido como o limite inferior, então o valor de c = 6, previamente calculado, é adicionado a este valor, assim obtém o limite superior da primeira classe.

Procedemos da mesma maneira para construir o resto das classes, conforme mostrado na tabela a seguir:

Cada frequência corresponde a uma cor da figura 2, desta forma é garantido que nenhum valor escapa da contagem..

Cálculo da média

X = (5 x 18,5 +25 x 25,0 + 10 x 31,5 + 6 x 38,0 + 2 x 44,5 + 2 x 51,0) ÷ 50 = 29,03 km / h

Cálculo da mediana

A mediana está na classe 2 da tabela, visto que são os primeiros 30 dados da distribuição.

-Largura do intervalo ao qual pertence a mediana: c = 6

-Limite inferior do intervalo onde a mediana é: BM = 22,0 km / h

-Número de observações que o intervalo f contémm = 25

-Dados totais divididos por 2: 50/2 = 25

-Número de observações que existem antes do intervalo contendo a mediana: fBM = 5

E a operação é:

Mediana = 22,0 + [(25-5) ÷ 25] × 6 = 26,80 km / h

Cálculo de moda

A moda também está na classe 2:

-Largura do intervalo: c = 6

-Limite inferior da classe onde o modo é encontrado: L1 = 22,0

-Subtraia entre a frequência da classe modal e a frequência da classe que a precede: Δ1 = 25-5 = 20

-Subtraia entre a frequência da classe modal e a frequência da classe que se segue: Δdois = 25 - 10 = 15

Com esses dados, a operação é:

Modo = 22,0 + [20 ÷ (20 + 15)] x6 = 25,4 km / h

Cálculo da média geométrica

N = f1 + Fdois + F3 +… = 50

log G = (5 x log 18,5 + 25 x log 25 + 10 x log 31,5 + 6 x log 38 + 2 × log 44,5 + 2 x log 51) / 50 =

log G = 1,44916053

G = 28,13 km / h

Cálculo da média harmônica

1 / H = (1/50) x [(5 / 18,5) + (25/25) + (10 / 31,5) + (6/38) + (2 / 44,5) + (2/51)] = 0,0366

H = 27,32 km / h

Resumo das medidas de tendência central

As unidades das variáveis ​​são km / h:

-Média: 29,03

-Mediana: 26,80

-Moda: 25,40

-Média geométrica: 28,13

-Média Harmônica: 27,32

Referências

  1. Berenson, M. 1985. Statistics for management and economics. Interamericana S.A.
  2. Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. Colina Mcgraw.
  3. Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
  4. Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
  5. Spiegel, M. 2009. Estatísticas. Schaum series. 4º Edição. Colina Mcgraw.
  6. Tratamento de dados agrupados. Recuperado de: itchihuahua.edu.mx.
  7. Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.

Ainda sem comentários