Variáveis em regressão para avaliação imobiliária: como classificar e evitar erros no laudo

A qualidade de um modelo de inferência estatística em avaliação imobiliária começa antes do cálculo: começa na classificação correta de cada variável. Um erro de tipagem neste estágio compromete toda a interpretação posterior dos coeficientes, dos testes de significância e, principalmente, da validade técnica do laudo pericial.

Este artigo apresenta, de forma prática, os três tipos de variável reconhecidos pela NBR 14653-2 para modelos de regressão aplicados à avaliação de imóveis: quantitativa, qualitativa e dicotômica. Ao final, você terá clareza sobre como decidir o tipo de cada característica do seu modelo e como documentar essa decisão no laudo.

Gráfico de regressão linear mostrando a relação entre área privativa (m²) e valor avaliado (R$), com R² = 0,87 e coeficiente β₁ ≈ R$ 3.200/m²

A qualidade de um modelo de inferência estatística em avaliação imobiliária começa antes do cálculo: começa na classificação correta de cada variável

A regressão linear múltipla assume que cada variável independente entra no modelo de acordo com sua natureza matemática. Quando essa natureza é violada, dois tipos de problema surgem:

Distorção dos coeficientes — o modelo atribui um peso indevido à variável, inflando ou subestimando seu efeito real.
Violação de pressupostos — normalidade dos resíduos, homocedasticidade e independência podem ser quebradas, invalidando testes estatísticos como t de Student e F de Snedecor.

Ambos os problemas são invisíveis para quem apenas observa o R² do modelo: um modelo pode apresentar coeficiente de determinação elevado mesmo quando as variáveis estão mal tipadas. Por isso, a NBR 14653-2 exige que o laudo documente explicitamente o tipo de cada variável utilizada.

Os três tipos fundamentais

Variável quantitativa

Uma variável quantitativa expressa uma grandeza mensurável em escala numérica, onde a distância entre os valores carrega significado real e proporcional. Em avaliação imobiliária, são exemplos clássicos:

Área privativa ou área total em metros quadrados
Distância a um polo valorizante (metros)
Idade aparente do imóvel em anos
Número de vagas de garagem
Andar em que se localiza a unidade

A proporcionalidade é a chave: a diferença entre 80 m² e 100 m² representa o mesmo impacto que a diferença entre 150 m² e 170 m². O coeficiente estimado pelo modelo pode ser lido diretamente como "cada unidade adicional desta variável altera o valor em X reais".

Variável qualitativa

Quando a característica não admite escala numérica natural — por exemplo, padrão construtivo, tipo de acabamento ou classificação do entorno — ela é qualitativa. Aqui está a fonte mais comum de erro técnico em avaliações.

O erro frequente é codificar as categorias com números sequenciais (1 = baixo, 2 = médio, 3 = alto) e inserir essa variável no modelo como se fosse quantitativa. O problema é grave: ao tratar o código como número, o modelo assume que a diferença entre padrão baixo e médio é igual à diferença entre médio e alto, e que essa diferença é proporcional ao código. Isso raramente corresponde à realidade de mercado — a passagem de baixo para médio pode representar um salto de valor muito maior do que de médio para alto.

A solução tecnicamente correta para variáveis qualitativas com três ou mais categorias é transformá-las em um conjunto de variáveis dicotômicas, uma para cada categoria, exceto uma categoria escolhida como referência. É o conceito de dummy expansion, detalhado mais adiante.

Variável dicotômica

A variável dicotômica, também chamada de dummy, representa a presença ou ausência de uma única característica e assume apenas dois valores. Exemplos diretos em avaliação imobiliária:

Imóvel possui vista para o mar: sim ou não
Localização em condomínio fechado: sim ou não
Posicionamento de esquina: sim ou não

A dicotômica é o instrumento certo para incluir categorias qualitativas no modelo sem impor uma falsa proporcionalidade entre elas.

Por que a convenção é 0 e 1 (e não outro par)

Uma dúvida técnica recorrente entre peritos em formação é se a escolha dos valores 0 e 1 é arbitrária. Não é.

Matematicamente, qualquer par de valores distintos codifica a variável de forma equivalente dentro da álgebra da regressão — o modelo estima um coeficiente proporcional à diferença entre os códigos. Porém, a convenção 0 e 1 é a única que preserva a interpretação direta do coeficiente:

O intercepto do modelo representa o valor esperado para o grupo codificado como 0, ou seja, a categoria de referência.
O coeficiente da dummy representa exatamente o efeito médio de "ter" a característica em relação a "não ter", mantidas as demais variáveis constantes.

Se a codificação for 1 e 2, por exemplo, o coeficiente ainda captura a diferença entre os grupos, mas a leitura do intercepto muda e a interpretação do modelo fica menos intuitiva, sem nenhum ganho técnico em compensação. Por isso, a convenção 0 e 1 é universalmente adotada na prática estatística e deve ser seguida no laudo pericial para evitar ambiguidade na leitura dos resultados.

Quando o atributo não pode ser medido diretamente

Existem situações em que a característica relevante para o valor do imóvel não pode ser medida de forma direta nem categorizada de forma simples. Nesses casos, o modelador recorre à variável proxy: uma medida indireta que substitui o atributo de interesse por correlação.

A proxy não constitui um quarto tipo fundamental de variável. Ela é uma estratégia que utiliza uma variável quantitativa ou qualitativa já disponível para representar indiretamente algo que não está nos dados. Exemplos comuns incluem o uso de índice de mercado para capturar a valorização ao longo do tempo, ou a distância a um equipamento urbano para representar a qualidade da localização.

A escolha da proxy deve ser justificada no laudo com base em evidência empírica da correlação entre a proxy e o atributo de interesse. Sem essa justificativa, a variável pode ser questionada tecnicamente.

Como decidir o tipo de cada variável

A decisão prática pode ser orientada por quatro perguntas, nesta ordem:

PerguntaSe sim, tratar como ------ A característica tem escala numérica com distâncias proporcionais?Quantitativa (valor direto) A característica é categórica com apenas duas opções?Dicotômica (codificada 0 e 1) A característica é categórica com três ou mais opções sem ordem proporcional?Conjunto de dicotômicas, uma por categoria A característica não pode ser medida diretamente, mas existe indicador correlacionado?Proxy (com justificativa)

Esta árvore de decisão não substitui o julgamento técnico do perito, mas organiza o raciocínio e reduz a chance de tipagem inadequada.

O que registrar no laudo

Para cada variável incluída no modelo, o laudo deve apresentar, de forma clara e auditável:

O tipo de variável e a justificativa da classificação.
Para dicotômicas: qual categoria foi definida como referência (código 0) e por quê.
Para qualitativas com múltiplas categorias: como foram desdobradas em variáveis dicotômicas, com a categoria de referência explicitada.
A significância estatística da variável no modelo final, com os testes aplicados e seus resultados.

Um laudo que apresenta uma variável de padrão construtivo codificada como 1, 2, 3 e inserida na regressão como quantitativa, sem o desdobramento em dummies, está sujeito a questionamento técnico — mesmo que o valor final do imóvel pareça razoável. A coerência entre a tipagem declarada e o tratamento estatístico aplicado é parte da fundamentação do trabalho pericial.

Resumo prático

Tipo de variávelExemplo em avaliaçãoTratamento no modelo --------- QuantitativaÁrea, distância, idadeValor numérico direto Qualitativa (2 categorias)Vista para o mar: sim/nãoDicotômica codificada 0 e 1 Qualitativa (3 ou mais)Padrão construtivo: baixo, médio, altoConjunto de dummies com categoria de referência ProxyÍndice de mercado representando valorizaçãoVariável quantitativa ou qualitativa como substituta indireta

A correta classificação das variáveis é o primeiro passo para um modelo de regressão defensável tecnicamente e para um laudo pericial que resiste ao escrutínio de assistentes técnicos, juízes e tribunais.