Visão geral da ajuda do CRISP-DM

CRISP-DM, que significa Processo Padrão de Vários Segmentos de Mercados para Mineração de Dados, é uma forma comprovada pelo mercado para orientar seus esforços de mineração de dados.|

  • Como uma metodologia, ela inclui descrições das fases típicas de um projeto, as tarefas envolvidas em cada fase e uma explicação dos relacionamentos entre essas tarefas.
  • Como um modelo de processo, o CRISP-DM fornece uma visão geral do ciclo de vida da mineração de dados.
Figura 1. O ciclo de vida da mineração de dados
O ciclo de vida da mineração de dados

O modelo de ciclo de vida é composto de seis fases com setas indicando as dependências mais importantes e frequentes entre as fases. A sequência das fases não é rigorosa. De fato, a maioria dos projetos vão e voltam entre as fases, conforme necessário.

O modelo CRISP-DM é flexível e pode ser facilmente customizado. Por exemplo, se sua organização planejar detectar a lavagem de dinheiro, é provável que você examine detalhadamente grandes quantidades de dados sem uma meta de modelagem específica. Em vez da modelagem, seu trabalho irá se concentrar na exploração e visualização de dados para descobrir os padrões suspeitos em dados financeiros. O CRISP-DM permite que você crie um modelo de mineração de dados que se encaixe em suas necessidades específicas.

Em tal situação, as fases de modelagem, avaliação e implementação podem ser menos relevantes do que as fases de entendimento e preparação de dados. Entretanto, ainda é importante considerar algumas das questões levantadas durante essas fases posteriores para o planejamento de longo prazo e para futuras metas de mineração de dados.