Variáveis em regressão para avaliação imobiliária: como classificar e evitar erros no laudo
A qualidade de um modelo de inferência estatística em avaliação imobiliária começa antes do cálculo: começa na classificação correta de cada variável. Um erro de tipagem neste estágio compromete toda a interpretação posterior dos coeficientes, dos testes de significância e, principalmente, da validade técnica do laudo pericial.
Este artigo apresenta, de forma prática, os três tipos de variável reconhecidos pela NBR 14653-2 para modelos de regressão aplicados à avaliação de imóveis: quantitativa, qualitativa e dicotômica. Ao final, você terá clareza sobre como decidir o tipo de cada característica do seu modelo e como documentar essa decisão no laudo.
A qualidade de um modelo de inferência estatística em avaliação imobiliária começa antes do cálculo: começa na classificação correta de cada variável
A regressão linear múltipla assume que cada variável independente entra no modelo de acordo com sua natureza matemática. Quando essa natureza é violada, dois tipos de problema surgem:
- Distorção dos coeficientes — o modelo atribui um peso indevido à variável, inflando ou subestimando seu efeito real.
- Violação de pressupostos — normalidade dos resíduos, homocedasticidade e independência podem ser quebradas, invalidando testes estatísticos como t de Student e F de Snedecor.
Os três tipos fundamentais
Variável quantitativa
Uma variável quantitativa expressa uma grandeza mensurável em escala numérica, onde a distância entre os valores carrega significado real e proporcional. Em avaliação imobiliária, são exemplos clássicos:
- Área privativa ou área total em metros quadrados
- Distância a um polo valorizante (metros)
- Idade aparente do imóvel em anos
- Número de vagas de garagem
- Andar em que se localiza a unidade
Variável qualitativa
Quando a característica não admite escala numérica natural — por exemplo, padrão construtivo, tipo de acabamento ou classificação do entorno — ela é qualitativa. Aqui está a fonte mais comum de erro técnico em avaliações.
O erro frequente é codificar as categorias com números sequenciais (1 = baixo, 2 = médio, 3 = alto) e inserir essa variável no modelo como se fosse quantitativa. O problema é grave: ao tratar o código como número, o modelo assume que a diferença entre padrão baixo e médio é igual à diferença entre médio e alto, e que essa diferença é proporcional ao código. Isso raramente corresponde à realidade de mercado — a passagem de baixo para médio pode representar um salto de valor muito maior do que de médio para alto.
A solução tecnicamente correta para variáveis qualitativas com três ou mais categorias é transformá-las em um conjunto de variáveis dicotômicas, uma para cada categoria, exceto uma categoria escolhida como referência. É o conceito de dummy expansion, detalhado mais adiante.
Variável dicotômica
A variável dicotômica, também chamada de dummy, representa a presença ou ausência de uma única característica e assume apenas dois valores. Exemplos diretos em avaliação imobiliária:
- Imóvel possui vista para o mar: sim ou não
- Localização em condomínio fechado: sim ou não
- Posicionamento de esquina: sim ou não
Por que a convenção é 0 e 1 (e não outro par)
Uma dúvida técnica recorrente entre peritos em formação é se a escolha dos valores 0 e 1 é arbitrária. Não é.
Matematicamente, qualquer par de valores distintos codifica a variável de forma equivalente dentro da álgebra da regressão — o modelo estima um coeficiente proporcional à diferença entre os códigos. Porém, a convenção 0 e 1 é a única que preserva a interpretação direta do coeficiente:
- O intercepto do modelo representa o valor esperado para o grupo codificado como 0, ou seja, a categoria de referência.
- O coeficiente da dummy representa exatamente o efeito médio de "ter" a característica em relação a "não ter", mantidas as demais variáveis constantes.
Quando o atributo não pode ser medido diretamente
Existem situações em que a característica relevante para o valor do imóvel não pode ser medida de forma direta nem categorizada de forma simples. Nesses casos, o modelador recorre à variável proxy: uma medida indireta que substitui o atributo de interesse por correlação.
A proxy não constitui um quarto tipo fundamental de variável. Ela é uma estratégia que utiliza uma variável quantitativa ou qualitativa já disponível para representar indiretamente algo que não está nos dados. Exemplos comuns incluem o uso de índice de mercado para capturar a valorização ao longo do tempo, ou a distância a um equipamento urbano para representar a qualidade da localização.
A escolha da proxy deve ser justificada no laudo com base em evidência empírica da correlação entre a proxy e o atributo de interesse. Sem essa justificativa, a variável pode ser questionada tecnicamente.
Como decidir o tipo de cada variável
A decisão prática pode ser orientada por quatro perguntas, nesta ordem:
Esta árvore de decisão não substitui o julgamento técnico do perito, mas organiza o raciocínio e reduz a chance de tipagem inadequada.
O que registrar no laudo
Para cada variável incluída no modelo, o laudo deve apresentar, de forma clara e auditável:
- O tipo de variável e a justificativa da classificação.
- Para dicotômicas: qual categoria foi definida como referência (código 0) e por quê.
- Para qualitativas com múltiplas categorias: como foram desdobradas em variáveis dicotômicas, com a categoria de referência explicitada.
- A significância estatística da variável no modelo final, com os testes aplicados e seus resultados.
Resumo prático
A correta classificação das variáveis é o primeiro passo para um modelo de regressão defensável tecnicamente e para um laudo pericial que resiste ao escrutínio de assistentes técnicos, juízes e tribunais.