Graus de liberdade como calculá-los, tipos, exemplos

2617
Abraham McLaughlin

graus de liberdade em estatística, eles são o número de componentes independentes de um vetor aleatório. Se o vetor tiver n componentes e há p equações lineares que relacionam seus componentes, então o grau de liberdade é n-p.

O conceito de graus de liberdade Ele também aparece na mecânica teórica, onde aproximadamente eles são equivalentes à dimensão do espaço onde a partícula se move, menos o número de ligações..

Figura 1. Um pêndulo se move em duas dimensões, mas tem apenas um grau de liberdade porque é forçado a se mover em um arco de raio L. Fonte: F. Zapata.

Este artigo irá discutir o conceito de graus de liberdade aplicado à estatística, mas um exemplo mecânico é mais fácil de visualizar na forma geométrica.

Índice do artigo

  • 1 Tipos de graus de liberdade
    • 1.1 Em uma caixa mecânica
    • 1.2 Em um conjunto de valores aleatórios
  • 2 exemplos
    • 2.1 Variância e graus de liberdade
    • 2.2 Na distribuição de Chi quadrado
    • 2.3 Em teste de hipótese (com exemplo elaborado)
  • 3 referências

Tipos de graus de liberdade

Dependendo do contexto em que é aplicado, a forma de calcular o número de graus de liberdade pode variar, mas a ideia subjacente é sempre a mesma: dimensões totais menos número de restrições.

Em um caso mecânico

Vamos considerar uma partícula oscilante amarrada a uma corda (um pêndulo) que se move no plano vertical x-y (2 dimensões). No entanto, a partícula é forçada a se mover na circunferência do raio igual ao comprimento da corda.

Uma vez que a partícula só pode se mover nessa curva, o número de graus de liberdade é 1. Isso pode ser visto na figura 1.

A maneira de calcular o número de graus de liberdade é tomando a diferença do número de dimensões menos o número de restrições:

graus de liberdade: = 2 (dimensões) - 1 (ligadura) = 1

Outra explicação que nos permite chegar ao resultado é a seguinte:

-Sabemos que a posição em duas dimensões é representada por um ponto de coordenadas (x, y).

-Mas como o ponto deve satisfazer a equação da circunferência (xdois + Ydois = Ldois) para um determinado valor da variável x, a variável y é determinada pela referida equação ou restrição.

Assim, apenas uma das variáveis ​​é independente e o sistema tem um (1) grau de liberdade.

Em um conjunto de valores aleatórios

Para ilustrar o que o conceito significa, suponha que o vetor

x = (x1, xdois,..., xn)

O que representa a amostra de n valores aleatórios normalmente distribuídos. Neste caso, o vetor aleatório x ter n componentes independentes e, portanto, é dito que x ter n graus de liberdade.

Agora vamos construir o vetor r De resíduos

r = (x1 - , xdois - ,…., Xn - )

Onde representa a média da amostra, que é calculada da seguinte forma:

= (x1 + xdois +…. + Xn) / n

Então a soma

(x1 - ) + (xdois - ) +…. + (Xn - ) = (x1 + xdois +…. + Xn) - n= 0

É uma equação que representa uma restrição (ou ligação) nos elementos do vetor r dos resíduos, uma vez que se n-1 componentes do vetor são conhecidos r, a equação de restrição determina o componente desconhecido.

Portanto, o vetor r de dimensão n com a restrição:

∑ (xeu - ) = 0

Ter (n - 1) graus de liberdade.

Novamente, é aplicado que o cálculo do número de graus de liberdade é:

graus de liberdade: = n (dimensões) - 1 (restrições) = n-1

Exemplos

Variância e graus de liberdade

A variância sdois é definido como a média do quadrado dos desvios (ou resíduos) da amostra de n dados:

sdois = (rr) / (n-1)

Onde r é o vetor dos resíduos r = (x1 - , x2 - ,…., Xn - ) e a ponta grossa () é o operador de produto escalar. Alternativamente, a fórmula de variância pode ser escrita da seguinte forma:

sdois = ∑ (xeu - )dois / (n-1)

Em qualquer caso, deve-se notar que ao calcular a média do quadrado dos resíduos, ela é dividida por (n-1) e não por n, uma vez que conforme discutido na seção anterior, o número de graus de liberdade do vetor r é (n-1).

Se para o cálculo da variância foram divididos por n em vez de (n-1), o resultado teria um viés que é muito significativo para valores de n abaixo de 50.

Na literatura, a fórmula de variância também aparece com o divisor n ao invés de (n-1), quando se trata da variância de uma população.

Mas o conjunto da variável aleatória dos resíduos, representado pelo vetor r, Embora tenha dimensão n, possui apenas (n-1) graus de liberdade. No entanto, se o número de dados for grande o suficiente (n> 500), ambas as fórmulas convergem para o mesmo resultado.

Calculadoras e planilhas fornecem as duas versões da variância e do desvio padrão (que é a raiz quadrada da variância).

Nossa recomendação, diante da análise aqui apresentada, é sempre escolher a versão com (n-1) cada vez que for necessário calcular a variância ou desvio padrão, para evitar resultados enviesados..

Na distribuição do qui quadrado

Algumas distribuições de probabilidade em variável aleatória contínua dependem de um parâmetro chamado grau de liberdade, é o caso da distribuição Chi quadrado (χdois).

O nome deste parâmetro vem precisamente dos graus de liberdade do vetor aleatório subjacente ao qual esta distribuição se aplica.

Suponha que temos g populações, das quais as amostras de tamanho n são retiradas:

X1 = (x11, x1dois,… X1n)

X2 = (x21, x2dois,… X2n)

... .

Xj = (xj1, xjdois,… Xjn)

... .

Xg = (xg1, xgdois,… Xgn)

Uma população j o que tem média e desvio padrão Sj, segue a distribuição normal N (, Sj ).

A variável padronizada ou normalizada zjeu é definido como:

zjeu = (xjeu - ) / Sj.

E o vetor Zj é definido assim:

Zj = (zj1, zjdois,..., zjeu,..., zjn) e segue a distribuição normal padronizada N (0,1).

Portanto, a variável:

= ((z1^ 2 + z21^ 2 +…. + zg1^ 2),…., (Z1n^ 2 + z2n^ 2 +…. + zgn^ 2))

segue a distribuição χdois(g) chamado de distribuição do qui quadrado com grau de liberdade g.

No teste de hipótese (com exemplo elaborado)

Quando você deseja testar hipóteses com base em um determinado conjunto de dados aleatórios, você precisa saber o número de graus de liberdade g ser capaz de aplicar o teste de qui quadrado.

Figura 2. Existe relação entre a preferência de sorvete SABOR e o GÊNERO do cliente? Fonte: F. Zapata.

A título de exemplo, serão analisados ​​os dados coletados sobre as preferências de sorvete de chocolate ou morango entre homens e mulheres em uma determinada sorveteria. A frequência com que homens e mulheres escolhem morango ou chocolate está resumida na figura 2.

Primeiro, a tabela de frequências esperadas é calculada, que é preparada multiplicando o total de linhas por ele colunas de total, dividido por dados totais. O resultado é mostrado na figura a seguir:

Figura 3. Cálculo das frequências esperadas com base nas frequências observadas (valores em azul na figura 2). Fonte: F. Zapata.

Em seguida, passamos a calcular o Qui quadrado (a partir dos dados) usando a seguinte fórmula:

χdois = ∑ (Fou - Fe)dois / Fe

Onde Fou são as frequências observadas (Figura 2) e Fe são as frequências esperadas (Figura 3). O somatório passa por todas as linhas e colunas, que em nosso exemplo fornecem quatro termos.

Depois de fazer as operações, você obtém:

χdois = 0,2043.

Agora é necessário comparar com o Chi quadrado teórico, que depende do número de graus de liberdade g.

No nosso caso, este número é determinado da seguinte forma:

g = (# linhas - 1) (# colunas - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.

Acontece que o número de graus de liberdade g neste exemplo é 1.

Se você quiser verificar ou rejeitar a hipótese nula (H0: não há correlação entre GOSTO e GÊNERO) com um nível de significância de 1%, o valor de Qui-quadrado teórico é calculado com grau de liberdade g = 1.

Busca-se o valor que faz com que a frequência acumulada (1 - 0,01) = 0,99, ou seja, 99%. Este valor (que pode ser obtido nas tabelas) é 6,636.

À medida que o Chi teórico excede o calculado, a hipótese nula é verificada.

Ou seja, com os dados coletados, Não observado relação entre as variáveis ​​SABOR e GÊNERO.

Referências

  1. Minitab. Quais são os graus de liberdade? Recuperado de: support.minitab.com.
  2. Moore, David. (2009) Estatísticas aplicadas básicas. Editor Antoni Bosch.
  3. Leigh, Jennifer. Como calcular graus de liberdade em modelos estatísticos. Recuperado de: geniolandia.com
  4. Wikipedia. Grau de liberdade (estatísticas). Recuperado de: es.wikipedia.com
  5. Wikipedia. Grau de liberdade (físico). Recuperado de: es.wikipedia.com

Ainda sem comentários