Características e exemplos de variáveis ​​categóricas

1643
Egbert Haynes
Características e exemplos de variáveis ​​categóricas

O variável categórica É aquele usado em estatística para atribuir uma característica ou propriedade não numérica ou qualitativa a algum objeto, indivíduo, entidade, condição ou procedimento. É possível definir todos os tipos de variáveis ​​categóricas de acordo com cada necessidade. 

Exemplos de variáveis ​​categóricas são: cor, sexo, grupo sanguíneo, estado civil, tipo de material, forma de pagamento ou tipo de conta bancária, e são muito utilizadas no dia a dia..

Figura 1: A cor é uma variável categórica. Fonte: pixabay

As acima são as variáveis, mas seus valores possíveis são qualitativos, ou seja, de qualidade ou característica e não de medida numérica. Por exemplo, os valores possíveis para a variável sexo Eles são: macho , hembra.

Quando esta variável é armazenada em um programa de computador, ela pode ser declarada como uma variável de texto e os únicos valores aceitos serão aqueles já nomeados: Macho , Fêmea.

Porém a mesma variável sexo pode ser declarado e armazenado como um inteiro se um Macho é atribuído 1Fêmea o valor é atribuído dois. É por esta razão que as variáveis ​​categóricas às vezes são chamadas de tipo enumerado.

A principal característica das variáveis ​​categóricas é que, ao contrário de outras variáveis, como contínuas e discretas, não é possível fazer aritmética com elas. No entanto, você pode fazer estatísticas com eles, como será visto mais tarde.

Índice do artigo

  • 1 exemplos
  • 2 Classificação de variáveis ​​categóricas
    • 2.1 Categorias nominais 
    • 2.2 Categorias ordinais
    • 2.3 Categorias binárias
  • 3 Estatísticas com variáveis ​​categóricas
    • 3.1 Representação gráfica de variáveis ​​categóricas
  • 4 exercícios resolvidos
    • 4.1 Exercício 1
    • 4.2 Exemplo 2
    • 4.3 Exemplo 3
  • 5 referências

Exemplos

Observe os seguintes exemplos de variáveis ​​categóricas e seus valores possíveis:

-Grupo sanguineo, Faixa de valores: A, B, AB, O

-Estado civil, Valores categóricos: Solteiro (PARA), Casado (B), Viúvo (C) , Divorciado (D).

-Tipo de material, Categorias ou valores: 1 = Madeira, 2 = Metal, 3 = Plástico

-Forma de pagamento, Valores ou categorias: (1) Dinheiro, (2) Débito, (3) Transferência, (4) Crédito

Nos exemplos anteriores, um número foi associado a cada categoria de uma forma completamente arbitrária. 

Pode-se então pensar que esta associação numérica arbitrária o torna igual a um variável quantitativa discreta, mas não é, uma vez que as operações aritméticas não podem ser feitas com esses números.

Para ilustrar a ideia, na variável Forma de pagamento, a operação de soma não faz sentido:

 (1) Dinheiro + (2) Débito nunca será igual (3) Transferência

Classificação de variáveis ​​categóricas

A classificação é baseada no fato de eles terem ou não uma hierarquia implícita ou se o número de resultados possíveis for maior que dois ou dois.

Uma variável categórica com apenas um resultado possível não é uma variável, é uma constante categórica.

Categorias nominais 

Quando não podem ser representados por um número ou ter qualquer ordem. Por exemplo, a variável: Tipo_material, ttem valores nominais (Madeira, Metal, Plástico), eles não têm hierarquia ou ordem, mesmo quando um número arbitrário é atribuído a cada resposta ou categoria.

Ordinal categórico

Variável: Rendimento acadêmico

Valores nominais: Alto, Médio, Baixo

Embora os valores desta variável não sejam numéricos, eles têm uma ordem ou hierarquia implícita.

Categorias binárias

Estas são variáveis ​​nominais com duas respostas possíveis, por exemplo:

-Variável: Responder

-Valores nominais: Verdadeiro, Falso

Observe que a variável Responder não tem uma hierarquia implícita e só tem dois resultados possíveis, por isso é uma variável categórica binária.

Alguns autores chamam este tipo variável binária, e não considero que pertença ao variáveis ​​categóricas que são restritos àqueles com mais de três categorias possíveis.

Estatísticas com variáveis ​​categóricas

As estatísticas podem ser feitas com variáveis ​​categóricas, apesar de não serem variáveis ​​numéricas ou quantitativas. Por exemplo, para saber a tendência ou o valor mais provável de uma variável categórica, tome Moda.

Moda é, neste caso, o resultado ou valor mais repetido de uma variável categórica. Em variáveis ​​categóricas não é possível calcular nem a média nem a mediana.

A média não pode ser calculada porque a aritmética não pode ser feita com variáveis ​​categóricas. Tampouco o é a mediana, pois as variáveis ​​quantitativas ou categóricas não possuem ordem ou hierarquia, não sendo possível determinar um valor central..

Representação gráfica de variáveis ​​categóricas

Dada uma determinada variável categórica, pode ser encontrada a frequência ou número de vezes com que um resultado dessa variável é repetido. Se isso for feito para cada resultado, um gráfico da frequência em relação a cada categoria ou resultado pode ser feito..

Aqui estão alguns exemplos de como variáveis ​​categóricas podem ser representadas graficamente.

Exercícios resolvidos

Exercício 1

Uma empresa possui registros dos dados de 170 funcionários. Uma das variáveis ​​que estão nesses registros é: Estado civil. Esta variável possui quatro categorias ou valores possíveis:

Solteiro (PARA), Casado (B), Viúvo (C) , Divorciado (D).

Embora seja uma variável não numérica, é possível saber quantos dos registros totais estão em uma determinada categoria e ser representados na forma de um gráfico de barras, conforme mostrado na figura a seguir:

Figura 2. Representação dos resultados de uma variável categórica. Fonte: self made

Exemplo 2

Uma loja de calçados mantém um registro de suas vendas. Entre as variáveis ​​que gerenciam seus registros está a cor do calçado de cada modelo. A variável: 

Color_Shoe_Model_AW3

É categórico e tem cinco categorias ou valores possíveis. Para cada categoria desta variável, soma-se o número de vendas e estabelece-se o percentual delas. Os resultados são apresentados no gráfico da seguinte figura:

Figura 3. Variável categórica Cor _Shoe. Nesta variável, o modo é Branco. Fonte: self made.

Pode-se então dizer que o modelo de sapato AW3 que está em moda, o que é vendido com mais frequência é o Branco, seguido de perto por Preto

Pode-se dizer também que com 70% de probabilidade o próximo calçado vendido deste modelo será Branco ou Preto.

Esta informação pode ser útil para a loja ao fazer novos pedidos, ou pode até aplicar descontos nas cores menos vendidas devido ao excesso de estoque..

Exemplo 3

Para uma determinada população de doadores de sangue, você deseja representar o número de pessoas que pertencem a um determinado grupo sanguíneo. Uma forma gráfica de visualizar os resultados é por meio de um pictograma, que tem ao fundo uma tabela.

A primeira coluna representa a variável grupo sanguineo e seus possíveis resultados ou categorias. A segunda coluna apresenta a representação de forma icônica ou pictórica do número de pessoas em cada categoria. Em nosso exemplo, uma gota vermelha é usada como ícone, cada um representando 10 pessoas.

Figura 4. Pictograma. Fonte: self made

Referências

  1. Khan Academy. Analisando dados categóricos. Recuperado de: khanacademy.org
  2. Fórmulas do universo. Variável qualitativa. Recuperado de: univesoformulas.com
  3. Minitab. Quais são variáveis ​​categóricas, discretas e contínuas. Recuperado de: support.minitab.com
  4. Tutorial do Excel. Caracterização de variáveis. Recuperado de: help.xlslat.com.
  5. Wikipedia. Variável estatística. Recuperado de wikipedia.com
  6. Wikipedia. Variável categórica. Recuperado de wikipedia.com
  7. Wikipedia. Variável categórica. Recuperado de wikipedia.com

Ainda sem comentários