CRISP-DM no Varejo Alimentício · Da Gôndola ao Modelo
Como transformar dados de cupom fiscal, balanças e câmeras em decisões que reduzem perdas, agilizam o checkout e otimizam o layout do supermercado.
UNIVERSIDADE SENAI CIMATEC · Inteligência Artificial no Varejo AlimentícioBruno Cabral Chaves / Dilvan dos Anjos Junior / Grupo · Salvador / BA
01 · O Cenário
Três dores reais do supermercado modelo
Diagnóstico de causalidade no chão de loja: cada situação demanda uma técnica de mineração específica e uma fonte de dados própria.
A
Operação
Lentidão na pesagem de hortifrúti
Causa: dependência da memorização de códigos pelos operadores.
Consequência: formação de filas e erros de cobrança no PDV.
→ Visão Computacional · EfficientNetB0
B
Compras & Estoque
Imprecisão na previsão de demanda
Causa: modelos estatísticos obsoletos que ignoram a sazonalidade.
Consequência: desperdício de perecíveis ou ruptura nas gôndolas.
→ Aprendizado Supervisionado · KNN / XGBoost
C
Marketing & Layout
Layout de loja ineficiente
Causa: ausência de análise técnica entre categorias de produto.
Consequência: perda de venda casada e fluxo confuso.
→ Regras de Associação · Apriori
02 · O Framework
As 6 fases iterativas do CRISP-DM
Modelo de processo padrão da indústria desde 2000. Mais de 40% dos projetos de ciência de dados no mundo seguem este framework (KDnuggets, 2014; Schröer et al., 2021).
Por que CRISP-DM permanece relevante em 2026?
Independência de tecnologia: não amarra o supermercado a um fornecedor específico de IA, ERP ou nuvem.
Aderência ao varejo: integra requisitos de margem, ruptura e ticket médio à modelagem desde a fase 1.
Iteratividade: permite ajustar regras de associação à medida que o layout é validado em loja-piloto.
Auditabilidade: cada fase produz artefatos formais — essencial para LGPD e governança de dados.
60–80%
do esforço total é gasto em Preparação dos Dados (Anaconda, 2022)
18 sem.
três sprints incrementais até a primeira entrega em produção
03 · Aplicação Prática
O que acontece em cada fase, no chão da loja
Cada fase do CRISP-DM se traduz em ações concretas para resolver as Situações A, B e C identificadas no diagnóstico.
1
Entendimento do Negócio
"Qual problema resolveremos e como mediremos sucesso?"
Definir KPIs: tempo de checkout, MAPE de demanda, lift de vendas casadas
Mapear riscos: LGPD em imagens, dependência do ERP legado
Plano de 3 sprints (visão computacional, previsão, layout)
Aprovação de patrocinador executivo e gerentes de loja
Entregáveis: Carta de objetivos · Mapa de riscos · KPIs assinados
2
Entendimento dos Dados
"Quais dados existem e qual é a sua qualidade?"
Inventário do ERP: ~80 mil cupons/dia/loja, 25 mil SKUs
Captura de ~50 mil imagens/dia das balanças de hortifrúti
Mapeamento de quebras, validades e calendário de promoções
Achado-chave: 7% dos cupons têm peso sem SKU correto (Situação A)
Ferramentas: SQL · Pandas · Great Expectations
3
Preparação dos Dados
"Como transformar dados brutos em dataset modelável?"
Imputação por mediana para valores ausentes
Filtros IQR + Isolation Forest para outliers
Data Augmentation nas imagens (rotação, brilho, flip)