UMA Regra empírica É o resultado de experiência prática e observação da vida real. Por exemplo, é possível saber quais espécies de aves podem ser observadas em determinados locais em cada época do ano e a partir dessa observação pode ser estabelecida uma "regra" que descreve os ciclos de vida dessas aves..
Em estatística, a regra empírica refere-se à forma como as observações são agrupadas em torno de um valor central, a média ou média, em unidades de desvio padrão..
Suponha que você tenha um grupo de pessoas com altura média de 1,62 metros e desvio padrão de 0,25 metros, então a regra empírica permitiria definir, por exemplo, quantas pessoas estariam em um intervalo da média mais ou menos um desvio padrão?
Pela regra, 68% dos dados é mais ou menos um desvio padrão da média, ou seja, 68% das pessoas do grupo terão altura entre 1,37 (1,62-0,25) e 1,87 (1,62 + 0,25) metros.
Índice do artigo
A regra empírica é uma generalização do Teorema Tchebyshev e da Distribuição Normal.
O teorema de Tchebyshev diz que: para algum valor de k> 1, a probabilidade de uma variável aleatória cair entre a média menos k vezes o desvio padrão e a média mais k vezes, o desvio padrão é maior ou igual a (1 - 1 / kdois).
A vantagem desse teorema é que ele se aplica a variáveis aleatórias discretas ou contínuas com qualquer distribuição de probabilidade, mas a regra definida a partir dele nem sempre é muito precisa, pois depende da simetria da distribuição. Quanto mais distorcida for a distribuição da variável aleatória, menos ajustado à regra será seu comportamento.
A regra empírica definida a partir deste teorema é:
Se k = √2, diz-se que 50% dos dados estão no intervalo: [µ - √2 s, µ + √2 s]
Se k = 2, diz-se que 75% dos dados estão no intervalo: [µ - 2 s, µ + 2 s]
Se k = 3, diz-se que 89% dos dados estão no intervalo: [µ - 3 s, µ + 3 s]
A distribuição normal, ou sino gaussiano, permite estabelecer a Regra Empírica ou Regra 68 - 95 - 99,7.
A regra é baseada nas probabilidades de ocorrência de uma variável aleatória em intervalos entre a média menos um, dois ou três desvios padrão e a média mais um, dois ou três desvios padrão..
A regra empírica define os seguintes intervalos:
68,27% dos dados estão no intervalo: [µ - s, µ + s]
95,45% dos dados estão no intervalo: [µ - 2s, µ + 2s]
99,73% dos dados estão no intervalo: [µ - 3s, µ + 3s]
Na figura você pode ver como esses intervalos são apresentados e a relação entre eles ao aumentar a largura da base do gráfico.
A padronização da variável aleatória, ou seja, a expressão da variável aleatória em termos da variável z ou normal padrão, simplifica o uso da regra empírica, uma vez que a variável z possui média igual a zero e desvio padrão igual a 1.
Portanto, a aplicação da regra empírica em escala de uma variável normal padrão, z, define os seguintes intervalos:
68,27% dos dados estão no intervalo: [-1, 1]
95,45% dos dados estão no intervalo: [-2, 2]
99,73% dos dados estão no intervalo: [-3, 3]
A regra empírica permite cálculos abreviados ao trabalhar com uma distribuição normal.
Suponha que um grupo de 100 estudantes universitários tenha uma idade média de 23 anos, com um desvio padrão de 2 anos. Quais informações a regra empírica permite?
A aplicação da regra empírica envolve seguir as etapas:
Como a média é 23 e o desvio padrão é 2, os intervalos são:
[µ - s, µ + s] = [23 - 2, 23 + 2] = [21, 25]
[µ - 2s, µ + 2s] = [23 - 2 (2), 23 + 2 (2)] = [19, 27]
[µ - 3s, µ + 3s] = [23 - 3 (2), 23 + 3 (2)] = [17, 29]
(100) * 68,27% = 68 alunos aproximadamente
(100) * 95,45% = 95 alunos aproximadamente
(100) * 99,73% = aproximadamente 100 alunos
Pelo menos 68 alunos têm entre 21 e 25 anos.
Pelo menos 95 alunos têm entre 19 e 27 anos.
Quase 100 alunos têm entre 17 e 29 anos.
A regra empírica é uma forma rápida e prática de analisar dados estatísticos, tornando-se cada vez mais confiável à medida que a distribuição se aproxima da simetria..
Sua utilidade depende do campo em que é usado e das questões que são apresentadas. É muito útil saber que a ocorrência de valores de três desvios padrão abaixo ou acima da média é quase improvável, mesmo para variáveis de distribuição não normal, pelo menos 88,8% dos casos estão no intervalo de três sigma.
Nas ciências sociais, um resultado geralmente conclusivo é o intervalo da média mais ou menos dois sigma (95%), enquanto na física de partículas, um novo efeito requer um intervalo de cinco sigma (99,99994%) para ser considerado uma descoberta..
Em uma reserva de vida selvagem, estima-se que haja uma média de 16.000 coelhos com um desvio padrão de 500 coelhos. Se a distribuição da variável 'número de coelhos na reserva' for desconhecida, é possível estimar a probabilidade de a população de coelhos estar entre 15.000 e 17.000 coelhos?
O intervalo pode ser apresentado nestes termos:
15.000 = 16.000 - 1.000 = 16.000 - 2 (500) = µ - 2 s
17000 = 16000 + 1000 = 16000 + 2 (500) = µ + 2 s
Portanto: [15000, 17000] = [µ - 2 s, µ + 2 s]
Aplicando o teorema de Tchebyshev, há uma probabilidade de pelo menos 0,75 de que a população de coelhos na reserva de vida selvagem esteja entre 15.000 e 17.000 coelhos..
O peso médio das crianças de um ano em um país é normalmente distribuído com uma média de 10 quilos e um desvio padrão de aproximadamente 1 quilo.
a) Estime a porcentagem de crianças de um ano no país que têm peso médio entre 8 e 12 quilos.
8 = 10 - 2 = 10 - 2 (1) = µ - 2 s
12 = 10 + 2 = 10 + 2 (1) = µ + 2 s
Portanto: [8, 12] = [µ - 2s, µ + 2s]
Pela regra empírica, pode-se afirmar que 68,27% das crianças de um ano no país têm entre 8 e 12 quilos de peso.
b) Qual é a probabilidade de encontrar uma criança de um ano com 7 quilos ou menos?
7 = 10 - 3 = 10 - 3 (1) = µ - 3 s
Sabe-se que 7 quilos de peso representam o valor µ - 3s, assim como sabe-se que 99,73% das crianças têm entre 7 e 13 quilos de peso. Isso deixa apenas 0,27% do total de crianças para os extremos. Metade deles, 0,135%, tem 7 quilos ou menos e a outra metade, 0,135%, tem 11 quilos ou mais.
Assim, pode-se concluir que existe uma probabilidade de 0,00135 que uma criança pese 7 quilos ou menos.
c) Se a população do país chega a 50 milhões de habitantes e as crianças de 1 ano representam 1% da população do país, quantas crianças de um ano pesam entre 9 e 11 quilos?
9 = 10 - 1 = µ - s
11 = 10 + 1 = µ + s
Portanto: [9, 11] = [µ - s, µ + s]
Pela regra empírica, 68,27% das crianças de um ano no país estão no intervalo [µ - s, µ + s]
Há 500.000 crianças de um ano no país (1% de 50 milhões), portanto 341.350 crianças (68,27% de 500.000) pesam entre 9 e 11 quilos.
Ainda sem comentários