O graus de liberdade em estatística, eles são o número de componentes independentes de um vetor aleatório. Se o vetor tiver n componentes e há p equações lineares que relacionam seus componentes, então o grau de liberdade é n-p.
O conceito de graus de liberdade Ele também aparece na mecânica teórica, onde aproximadamente eles são equivalentes à dimensão do espaço onde a partícula se move, menos o número de ligações..
Este artigo irá discutir o conceito de graus de liberdade aplicado à estatística, mas um exemplo mecânico é mais fácil de visualizar na forma geométrica.
Índice do artigo
Dependendo do contexto em que é aplicado, a forma de calcular o número de graus de liberdade pode variar, mas a ideia subjacente é sempre a mesma: dimensões totais menos número de restrições.
Vamos considerar uma partícula oscilante amarrada a uma corda (um pêndulo) que se move no plano vertical x-y (2 dimensões). No entanto, a partícula é forçada a se mover na circunferência do raio igual ao comprimento da corda.
Uma vez que a partícula só pode se mover nessa curva, o número de graus de liberdade é 1. Isso pode ser visto na figura 1.
A maneira de calcular o número de graus de liberdade é tomando a diferença do número de dimensões menos o número de restrições:
graus de liberdade: = 2 (dimensões) - 1 (ligadura) = 1
Outra explicação que nos permite chegar ao resultado é a seguinte:
-Sabemos que a posição em duas dimensões é representada por um ponto de coordenadas (x, y).
-Mas como o ponto deve satisfazer a equação da circunferência (xdois + Ydois = Ldois) para um determinado valor da variável x, a variável y é determinada pela referida equação ou restrição.
Assim, apenas uma das variáveis é independente e o sistema tem um (1) grau de liberdade.
Para ilustrar o que o conceito significa, suponha que o vetor
x = (x1, xdois,..., xn)
O que representa a amostra de n valores aleatórios normalmente distribuídos. Neste caso, o vetor aleatório x ter n componentes independentes e, portanto, é dito que x ter n graus de liberdade.
Agora vamos construir o vetor r De resíduos
r = (x1 -
Onde
Então a soma
(x1 -
É uma equação que representa uma restrição (ou ligação) nos elementos do vetor r dos resíduos, uma vez que se n-1 componentes do vetor são conhecidos r, a equação de restrição determina o componente desconhecido.
Portanto, o vetor r de dimensão n com a restrição:
∑ (xeu -
Ter (n - 1) graus de liberdade.
Novamente, é aplicado que o cálculo do número de graus de liberdade é:
graus de liberdade: = n (dimensões) - 1 (restrições) = n-1
A variância sdois é definido como a média do quadrado dos desvios (ou resíduos) da amostra de n dados:
sdois = (r•r) / (n-1)
Onde r é o vetor dos resíduos r = (x1 -
sdois = ∑ (xeu -
Em qualquer caso, deve-se notar que ao calcular a média do quadrado dos resíduos, ela é dividida por (n-1) e não por n, uma vez que conforme discutido na seção anterior, o número de graus de liberdade do vetor r é (n-1).
Se para o cálculo da variância foram divididos por n em vez de (n-1), o resultado teria um viés que é muito significativo para valores de n abaixo de 50.
Na literatura, a fórmula de variância também aparece com o divisor n ao invés de (n-1), quando se trata da variância de uma população.
Mas o conjunto da variável aleatória dos resíduos, representado pelo vetor r, Embora tenha dimensão n, possui apenas (n-1) graus de liberdade. No entanto, se o número de dados for grande o suficiente (n> 500), ambas as fórmulas convergem para o mesmo resultado.
Calculadoras e planilhas fornecem as duas versões da variância e do desvio padrão (que é a raiz quadrada da variância).
Nossa recomendação, diante da análise aqui apresentada, é sempre escolher a versão com (n-1) cada vez que for necessário calcular a variância ou desvio padrão, para evitar resultados enviesados..
Algumas distribuições de probabilidade em variável aleatória contínua dependem de um parâmetro chamado grau de liberdade, é o caso da distribuição Chi quadrado (χdois).
O nome deste parâmetro vem precisamente dos graus de liberdade do vetor aleatório subjacente ao qual esta distribuição se aplica.
Suponha que temos g populações, das quais as amostras de tamanho n são retiradas:
X1 = (x11, x1dois,… X1n)
X2 = (x21, x2dois,… X2n)
... .
Xj = (xj1, xjdois,… Xjn)
... .
Xg = (xg1, xgdois,… Xgn)
Uma população j o que tem média
A variável padronizada ou normalizada zjeu é definido como:
zjeu = (xjeu -
E o vetor Zj é definido assim:
Zj = (zj1, zjdois,..., zjeu,..., zjn) e segue a distribuição normal padronizada N (0,1).
Portanto, a variável:
Q = ((z11 ^ 2 + z21^ 2 +…. + zg1^ 2),…., (Z1n^ 2 + z2n^ 2 +…. + zgn^ 2))
segue a distribuição χdois(g) chamado de distribuição do qui quadrado com grau de liberdade g.
Quando você deseja testar hipóteses com base em um determinado conjunto de dados aleatórios, você precisa saber o número de graus de liberdade g ser capaz de aplicar o teste de qui quadrado.
A título de exemplo, serão analisados os dados coletados sobre as preferências de sorvete de chocolate ou morango entre homens e mulheres em uma determinada sorveteria. A frequência com que homens e mulheres escolhem morango ou chocolate está resumida na figura 2.
Primeiro, a tabela de frequências esperadas é calculada, que é preparada multiplicando o total de linhas por ele colunas de total, dividido por dados totais. O resultado é mostrado na figura a seguir:
Em seguida, passamos a calcular o Qui quadrado (a partir dos dados) usando a seguinte fórmula:
χdois = ∑ (Fou - Fe)dois / Fe
Onde Fou são as frequências observadas (Figura 2) e Fe são as frequências esperadas (Figura 3). O somatório passa por todas as linhas e colunas, que em nosso exemplo fornecem quatro termos.
Depois de fazer as operações, você obtém:
χdois = 0,2043.
Agora é necessário comparar com o Chi quadrado teórico, que depende do número de graus de liberdade g.
No nosso caso, este número é determinado da seguinte forma:
g = (# linhas - 1) (# colunas - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Acontece que o número de graus de liberdade g neste exemplo é 1.
Se você quiser verificar ou rejeitar a hipótese nula (H0: não há correlação entre GOSTO e GÊNERO) com um nível de significância de 1%, o valor de Qui-quadrado teórico é calculado com grau de liberdade g = 1.
Busca-se o valor que faz com que a frequência acumulada (1 - 0,01) = 0,99, ou seja, 99%. Este valor (que pode ser obtido nas tabelas) é 6,636.
À medida que o Chi teórico excede o calculado, a hipótese nula é verificada.
Ou seja, com os dados coletados, Não observado relação entre as variáveis SABOR e GÊNERO.
Ainda sem comentários