A prova Chi ao quadrado ou qui-quadrado (χdois, onde χ é a letra grega chamada “chi”) é usado para determinar o comportamento de uma determinada variável e também quando você deseja saber se duas ou mais variáveis são estatisticamente independentes.
Para verificar o comportamento de uma variável, o teste a ser realizado é chamado teste de chi quadrado de ajuste. Para descobrir se duas ou mais variáveis são estatisticamente independentes, o teste é chamado quadrado da independência, também chamado contingência.
Esses testes fazem parte da teoria estatística da decisão, na qual uma população é estudada e as decisões sobre ela são tomadas, analisando uma ou mais amostras dela retiradas. Isso requer fazer certas suposições sobre as variáveis, chamadas hipótese, que pode ou não ser verdade.
Existem alguns testes para contrastar essas conjecturas e determinar quais são válidas, dentro de uma certa margem de confiança, incluindo o teste do qui-quadrado, que pode ser aplicado para comparar duas ou mais populações..
Como veremos, dois tipos de hipótese são geralmente levantados sobre algum parâmetro populacional em duas amostras: a hipótese nula, chamada Hou (as amostras são independentes), e a hipótese alternativa, denotada como H1, (as amostras são correlacionadas) que é o oposto disso.
Índice do artigo
O teste do qui quadrado é aplicado a variáveis que descrevem qualidades, como sexo, estado civil, grupo sanguíneo, cor dos olhos e preferências de vários tipos.
O teste é destinado quando você deseja:
-Verificar se uma distribuição é apropriada para descrever uma variável, que é chamada qualidade de ajuste. Por meio do teste do qui-quadrado, é possível saber se existem diferenças significativas entre a distribuição teórica selecionada e a distribuição de frequência observada..
-Saiba se duas variáveis X e Y são independentes do ponto de vista estatístico. Isso é conhecido como teste de independência.
Por ser aplicado a variáveis qualitativas ou categóricas, o teste do qui-quadrado é amplamente utilizado em ciências sociais, administração e medicina..
Existem dois requisitos importantes para aplicá-lo corretamente:
-Os dados devem ser agrupados em frequências.
-A amostra deve ser grande o suficiente para que a distribuição do qui-quadrado seja válida, caso contrário seu valor é superestimado e leva à rejeição da hipótese nula, quando não deveria ser o caso..
A regra geral é que se uma frequência com um valor menor que 5 aparecer nos dados agrupados, ela não é usada. Se houver mais de uma frequência menor que 5, eles devem ser combinados em um para obter uma frequência com um valor numérico maior que 5.
χdois é uma distribuição contínua de probabilidades. Na verdade, existem curvas diferentes, dependendo de um parâmetro k chamado graus de liberdade da variável aleatória.
Suas propriedades são:
-A área sob a curva é igual a 1.
-Os valores de χdois eles são positivos.
-A distribuição é assimétrica, ou seja, possui viés.
Conforme os graus de liberdade aumentam, a distribuição qui-quadrado tende à normalidade, como pode ser visto na figura.
Para uma determinada distribuição, os graus de liberdade são determinados por meio do tabela de contingência, que é a tabela onde as frequências observadas das variáveis são registradas.
Se uma mesa tem F linhas e c colunas, o valor de k isso é:
k = (f - 1) ⋅ (c - 1)
Quando o teste do qui-quadrado é adequado, as seguintes hipóteses são formuladas:
-Hou: a variável X tem uma distribuição de probabilidade f (x) com os parâmetros específicos y1, Ydois…, Yp
-H1: X tem outra distribuição de probabilidade.
A distribuição de probabilidade assumida na hipótese nula pode ser, por exemplo, a distribuição normal conhecida, e os parâmetros seriam a média μ e o desvio padrão σ.
Além disso, a hipótese nula é avaliada com um certo nível de significância, ou seja, uma medida do erro que seria cometido ao rejeitá-la sendo verdadeira..
Normalmente, este nível é definido como 1%, 5% ou 10% e, quanto mais baixo, mais confiável é o resultado do teste..
E se for utilizado o teste de contingência qui-quadrado, que, como já dissemos, serve para verificar a independência entre duas variáveis X e Y, as hipóteses são:
-Hou: as variáveis X e Y são independentes.
-H1: X e Y são dependentes.
Novamente, é necessário especificar um nível de significância para saber a medida do erro ao tomar a decisão..
A estatística do qui quadrado é calculada da seguinte forma:
A soma é realizada da primeira classe i = 1 para a última, que é i = k.
O que mais:
-Fou é uma frequência observada (vem dos dados obtidos).
-Fe é a frequência esperada ou teórica (precisa ser calculada a partir dos dados).
Para aceitar ou rejeitar a hipótese nula, calculamos χdois para os dados observados e comparados a um valor chamado quadrado chi crítico, que depende dos graus de liberdade k e o nível de significância α:
χdoiscrítico = χdoisk, α
Se, por exemplo, queremos realizar o teste com nível de significância de 1%, então α = 0,01, se for com 5% então α = 0,05 e assim sucessivamente. Definimos p, o parâmetro da distribuição, como:
p = 1 - α
Esses valores críticos de qui-quadrado são determinados por tabelas que contêm o valor acumulado da área. Por exemplo, para k = 1, que representa 1 grau de liberdade e α = 0,05, que é igual a p = 1- 0,05 = 0,95, o valor de χdois é 3.841.
O critério para aceitar Hou isso é:
-Sim χdois < χdoiscrítico H é aceitoou, caso contrário, é rejeitado (ver figura 1).
Na aplicação a seguir, o teste do qui quadrado será usado como um teste de independência.
Suponha que os pesquisadores queiram saber se a preferência por café preto está relacionada ao sexo da pessoa e especifique a resposta com um nível de significância de α = 0,05.
Para isso, está disponível uma amostra de 100 pessoas entrevistadas e suas respostas:
Estabeleça as hipóteses:
-Hou: gênero e preferência por café preto são independentes.
-H1: o gosto pelo café preto está relacionado ao gênero da pessoa.
Calcule as frequências esperadas para a distribuição, para as quais são necessários os totais somados na última linha e na coluna da direita da tabela. Cada célula na caixa vermelha tem um valor esperado Fe, que é calculado multiplicando o total de sua linha F pelo total de sua coluna C, dividido pelo total da amostra N:
Fe = (F x C) / N
Os resultados são os seguintes para cada célula:
-C1: (36 x 47) / 100 = 16,92
-C2: (64 x 47) / 100 = 30,08
-C3: (36 x 53) / 100 = 19,08
-C4: (64 x 53) / 100 = 33,92
Em seguida, a estatística qui-quadrado deve ser calculada para esta distribuição, de acordo com a fórmula fornecida:
Determinar χdoiscrítico, sabendo que os dados registrados estão em f = 2 linhas ec = 2 colunas, portanto, o número de graus de liberdade é:
k = (2-1) ⋅ (2-1) = 1.
O que significa que devemos olhar na tabela mostrada acima para o valor de χdoisk, α = χdois1; 0,05 , o qual é:
χdoiscrítico = 3.841
Compare os valores e decida:
χdois = 2,9005
χdoiscrítico = 3.841
Desde χdois < χdoiscrítico aceita-se a hipótese nula e conclui-se que a preferência pelo café preto não está vinculada ao sexo da pessoa, com nível de significância de 5%.
Ainda sem comentários