Fórmulas e equações de erro de amostragem, cálculo, exemplos

2483
Philip Kelley

O erro de amostragem ou erro de amostra Em estatística, é a diferença entre o valor médio de uma amostra e o valor médio da população total. Para ilustrar a ideia, vamos imaginar que a população total de uma cidade seja de um milhão de pessoas, da qual se deseja o tamanho médio do calçado, para o qual é retirada uma amostra aleatória de mil pessoas.

O tamanho médio que emerge da amostra não coincidirá necessariamente com o da população total, embora se a amostra não for enviesada o valor deve ser próximo. Essa diferença entre o valor médio da amostra e o da população total é o erro amostral.

Figura 1. Como a amostra é um subconjunto da população total, a média da amostra tem uma margem de erro. Fonte: F. Zapata.

Em geral, o valor médio da população total é desconhecido, mas existem técnicas para reduzir este erro e fórmulas para estimar o margem de erro de amostragem que será exposto neste artigo.

Índice do artigo

  • 1 Fórmulas e equações
  • 2 Como calcular o erro de amostragem
    • 2.1 Para um nível de confiança γ
  • 3 exemplos
    • 3.1 - Exemplo 1
    • 3.2 - Exemplo 2
    • 3.3 - Exemplo 3
    • 3.4 - Exemplo 4
    • 3.5 - Exercício 5
  • 4 referências

Fórmulas e equações

Digamos que você queira saber o valor médio de uma certa característica mensurável x em uma população de tamanho N, mas como N é um número grande, não é viável fazer o estudo sobre a população total, então passamos a fazer um amostra aleatória de tamanho n<.

O valor médio da amostra é denotado por e o valor médio da população total é denotado pela letra grega µ (lê-se mu ou miu).

Suponha que eles tomem m amostras da população total N, todos do mesmo tamanho n com valores médios 1>, dois>, 3>, ... .m>.

Esses valores médios não serão idênticos entre si e serão todos em torno do valor médio da população µ. O margem de erro de amostragem E indica a separação esperada dos valores médios sobre a valor médio da população μ dentro de uma porcentagem especificada chamada de nível de confiança γ (gama).

O margem de erro padrão ε amostra de tamanho n isso é:

ε = σ / √n

Onde σ é o desvio padrão (a raiz quadrada da variação), que é calculada usando a seguinte fórmula:

σ = √ [(x - )dois/ (n - 1)]

O significado de margem de erro padrão ε é o seguinte:

O valor médio obtido por tamanho de amostra n está no intervalo ( - ε, + ε) com um nível de confiança 68,3%.

Como calcular o erro de amostragem

Na seção anterior, a fórmula foi dada para encontrar o margem de erro padrão de uma amostra de tamanho n, onde a palavra padrão indica que é uma margem de erro com 68% de confiança.

Isso indica que se muitas amostras do mesmo tamanho foram tomadas n, 68% deles darão valores médios no intervalo [ - ε, + ε].

Existe uma regra simples, chamada de regra 68-95-99,7 o que nos permite encontrar a margem de erro de amostragem E para níveis de confiança de 68%, 95% Y 99,7% facilmente, uma vez que esta margem é 1⋅ε, 2⋅ε e 3⋅ε respectivamente.

Para um nível de confiança γ

Se ele nível de confiança γ não é nenhuma das opções acima, então o erro de amostragem é o desvio padrão σ multiplicado pelo fator , que é obtido através do seguinte procedimento:

1.- Primeiro o nível de significância α que é calculado a partir de nível de confiança γ usando a seguinte relação: α = 1 - γ

2.- Depois deve calcular o valor 1 - α / 2 = (1 + γ) / 2, que corresponde à frequência normal acumulada entre -∞ e , em uma distribuição gaussiana normal ou padronizada F (z), cuja definição pode ser vista na figura 2.

3.- A equação está resolvida F (Zγ) = 1 - α / 2 por meio das tabelas da distribuição normal (cumulativa) F, ou por meio de um aplicativo de computador que tem a função gaussiana padronizada inversa F-1.

No último caso, temos:

Zγ = G-1(1 - α / 2).

4.- Finalmente, esta fórmula é aplicada para o erro de amostragem com um nível de confiabilidade γ:

E = Zγ(σ / √n)

Figura 2. Tabela de distribuição normal. Fonte: Wikimedia Commons.

Exemplos

- Exemplo 1

Calcule o margem de erro padrão no peso médio de uma amostra de 100 recém-nascidos. O cálculo do peso médio foi = 3.100 kg com um desvio padrão σ = 1.500 kg.

Solução

O margem de erro padrão isso é ε = σ / √n = (1.500 kg) / √100 = 0,15 kg. O que significa que com esses dados pode-se inferir que o peso de 68% dos recém-nascidos está entre 2.950 kg e 3,25 kg.

- Exemplo 2

Determinar a margem de erro de amostragem E e a faixa de peso de 100 recém-nascidos com um nível de confiança de 95% se o peso médio for 3.100 kg com desvio padrão σ = 1.500 kg.

Solução

Se o regra 68; 95; 99,7 → 1⋅ε; 2⋅ε; 3⋅ε, se tem:

E = 2⋅ε = 2⋅0,15 kg = 0,30 kg

Ou seja, 95% dos recém-nascidos terão peso entre 2.800 kg e 3.400 kg.

- Exemplo 3

Determine a faixa de pesos dos recém-nascidos do Exemplo 1 com uma margem de confiança de 99,7%.

Solução

O erro de amostragem com 99,7% de confiança é 3 σ / √n, que para o nosso exemplo é E = 3 * 0,15 kg = 0,45 kg. A partir daqui infere-se que 99,7% dos recém-nascidos terão peso entre 2.650 kg e 3.550 kg.

- Exemplo 4

Determine o fator para um nível de confiabilidade de 75%. Determine a margem de erro de amostragem com este nível de confiabilidade para o caso apresentado no exemplo 1.

Solução

O nível de confiança isso é γ = 75% = 0,75 que está relacionado com o nível de significância α através do relacionamento γ= (1 - α), de modo que o nível de significância seja α = 1 - 0,75 = 0,25.

Isso significa que a probabilidade normal cumulativa entre -∞ e isso é:

P (Z ≤ ) = 1 - 0,125 = 0,875

O que corresponde a um valor 1.1503, conforme mostrado na Figura 3.

Figura 3. Determinação do fator Zγ correspondente a um nível de confiança de 75%. Fonte: F. Zapata através do Geogebra.

Ou seja, o erro de amostragem é E = Zγ(σ / √n)= 1,15(σ / √n).

Quando aplicado aos dados do exemplo 1, dá um erro de:

E = 1,15 * 0,15 kg = 0,17 kg

Com um nível de confiança de 75%.

- Exercício 5

Qual é o nível de confiança se Zα / 2 = 2,4 ?

Solução

P (Z ≤ Zα / 2 ) = 1 - α / 2

P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164

O nível de significância é:

α = 0,0164 = 1,64%

E, finalmente, o nível de confiança permanece:

1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%

Referências

  1. Canavos, G. 1988. Probabilidade e Estatística: Aplicações e métodos. Colina Mcgraw.
  2. Devore, J. 2012. Probability and Statistics for Engineering and Science. 8º. Edição. Cengage.
  3. Levin, R. 1988. Statistics for Administrators. 2ª Edição. Prentice Hall.
  4. Sudman, S. 1982. Fazendo perguntas: um guia prático para o desenho de questionários. São Francisco. Baixo Jossey.
  5. Walpole, R. 2007. Probabilidade e Estatística para Engenharia e Ciências. Pearson.
  6. Wonnacott, T.H. e R.J. Wonnacott. 1990. Estatísticas introdutórias. 5ª Ed. Wiley
  7. Wikipedia. Erro de amostragem. Recuperado de: en.wikipedia.com
  8. Wikipedia. Margem de erro. Recuperado de: en.wikipedia.com

Ainda sem comentários