O variável categórica É aquele usado em estatística para atribuir uma característica ou propriedade não numérica ou qualitativa a algum objeto, indivíduo, entidade, condição ou procedimento. É possível definir todos os tipos de variáveis categóricas de acordo com cada necessidade.
Exemplos de variáveis categóricas são: cor, sexo, grupo sanguíneo, estado civil, tipo de material, forma de pagamento ou tipo de conta bancária, e são muito utilizadas no dia a dia..
As acima são as variáveis, mas seus valores possíveis são qualitativos, ou seja, de qualidade ou característica e não de medida numérica. Por exemplo, os valores possíveis para a variável sexo Eles são: macho , hembra.
Quando esta variável é armazenada em um programa de computador, ela pode ser declarada como uma variável de texto e os únicos valores aceitos serão aqueles já nomeados: Macho , Fêmea.
Porém a mesma variável sexo pode ser declarado e armazenado como um inteiro se um Macho é atribuído 1 já Fêmea o valor é atribuído dois. É por esta razão que as variáveis categóricas às vezes são chamadas de tipo enumerado.
A principal característica das variáveis categóricas é que, ao contrário de outras variáveis, como contínuas e discretas, não é possível fazer aritmética com elas. No entanto, você pode fazer estatísticas com eles, como será visto mais tarde.
Índice do artigo
Observe os seguintes exemplos de variáveis categóricas e seus valores possíveis:
-Grupo sanguineo, Faixa de valores: A, B, AB, O
-Estado civil, Valores categóricos: Solteiro (PARA), Casado (B), Viúvo (C) , Divorciado (D).
-Tipo de material, Categorias ou valores: 1 = Madeira, 2 = Metal, 3 = Plástico
-Forma de pagamento, Valores ou categorias: (1) Dinheiro, (2) Débito, (3) Transferência, (4) Crédito
Nos exemplos anteriores, um número foi associado a cada categoria de uma forma completamente arbitrária.
Pode-se então pensar que esta associação numérica arbitrária o torna igual a um variável quantitativa discreta, mas não é, uma vez que as operações aritméticas não podem ser feitas com esses números.
Para ilustrar a ideia, na variável Forma de pagamento, a operação de soma não faz sentido:
(1) Dinheiro + (2) Débito nunca será igual (3) Transferência
A classificação é baseada no fato de eles terem ou não uma hierarquia implícita ou se o número de resultados possíveis for maior que dois ou dois.
Uma variável categórica com apenas um resultado possível não é uma variável, é uma constante categórica.
Quando não podem ser representados por um número ou ter qualquer ordem. Por exemplo, a variável: Tipo_material, ttem valores nominais (Madeira, Metal, Plástico), eles não têm hierarquia ou ordem, mesmo quando um número arbitrário é atribuído a cada resposta ou categoria.
Variável: Rendimento acadêmico
Valores nominais: Alto, Médio, Baixo
Embora os valores desta variável não sejam numéricos, eles têm uma ordem ou hierarquia implícita.
Estas são variáveis nominais com duas respostas possíveis, por exemplo:
-Variável: Responder
-Valores nominais: Verdadeiro, Falso
Observe que a variável Responder não tem uma hierarquia implícita e só tem dois resultados possíveis, por isso é uma variável categórica binária.
Alguns autores chamam este tipo variável binária, e não considero que pertença ao variáveis categóricas que são restritos àqueles com mais de três categorias possíveis.
As estatísticas podem ser feitas com variáveis categóricas, apesar de não serem variáveis numéricas ou quantitativas. Por exemplo, para saber a tendência ou o valor mais provável de uma variável categórica, tome Moda.
Moda é, neste caso, o resultado ou valor mais repetido de uma variável categórica. Em variáveis categóricas não é possível calcular nem a média nem a mediana.
A média não pode ser calculada porque a aritmética não pode ser feita com variáveis categóricas. Tampouco o é a mediana, pois as variáveis quantitativas ou categóricas não possuem ordem ou hierarquia, não sendo possível determinar um valor central..
Dada uma determinada variável categórica, pode ser encontrada a frequência ou número de vezes com que um resultado dessa variável é repetido. Se isso for feito para cada resultado, um gráfico da frequência em relação a cada categoria ou resultado pode ser feito..
Aqui estão alguns exemplos de como variáveis categóricas podem ser representadas graficamente.
Uma empresa possui registros dos dados de 170 funcionários. Uma das variáveis que estão nesses registros é: Estado civil. Esta variável possui quatro categorias ou valores possíveis:
Solteiro (PARA), Casado (B), Viúvo (C) , Divorciado (D).
Embora seja uma variável não numérica, é possível saber quantos dos registros totais estão em uma determinada categoria e ser representados na forma de um gráfico de barras, conforme mostrado na figura a seguir:
Uma loja de calçados mantém um registro de suas vendas. Entre as variáveis que gerenciam seus registros está a cor do calçado de cada modelo. A variável:
Color_Shoe_Model_AW3
É categórico e tem cinco categorias ou valores possíveis. Para cada categoria desta variável, soma-se o número de vendas e estabelece-se o percentual delas. Os resultados são apresentados no gráfico da seguinte figura:
Pode-se então dizer que o modelo de sapato AW3 que está em moda, o que é vendido com mais frequência é o Branco, seguido de perto por Preto.
Pode-se dizer também que com 70% de probabilidade o próximo calçado vendido deste modelo será Branco ou Preto.
Esta informação pode ser útil para a loja ao fazer novos pedidos, ou pode até aplicar descontos nas cores menos vendidas devido ao excesso de estoque..
Para uma determinada população de doadores de sangue, você deseja representar o número de pessoas que pertencem a um determinado grupo sanguíneo. Uma forma gráfica de visualizar os resultados é por meio de um pictograma, que tem ao fundo uma tabela.
A primeira coluna representa a variável grupo sanguineo e seus possíveis resultados ou categorias. A segunda coluna apresenta a representação de forma icônica ou pictórica do número de pessoas em cada categoria. Em nosso exemplo, uma gota vermelha é usada como ícone, cada um representando 10 pessoas.
Ainda sem comentários