Master Data, ou, Dados Mestre, como resolveu-se traduzir ou convencionar para a língua portuguesa. Por que isso tem tudo a ver com adata_caos vida de DBA’s, DA’s, e Desenvolvedores?

O conceito não é novo. Mas, em tempos de Real forte, aquisições, fusões, joint-ventures, crescimento e prosperidade em terras brasilis, este conceito ganha bojo e destaque em corporações de médio e grande portes. Do conceito de Master Data lança-se ao MDM (Master Data Management), e, é a base para qualquer processo de Data Quality. Neste artigo vou usar o estrangeirismo, pois, acho mais bonitinho 🙂

Se fizermos uma busca na internet sobre o que é Master Data, encontraremos inúmeras definições, particularmente, prefiro as definições endereçadas pela Oracle e Semarchy.

Master Data é o conjunto de dados mais cruciais para qualquer negócio. São aqueles dados mais viscerais, aqueles que melhor descrevem uma corporação, e, sem os quais a corporação e/ou entidade deixaria de existir, ou, no mínimo, sofreria um enorme impacto.

Geralmente, este conjunto de dados que definimos como Master Data, são, essencialmente, dados descritivos (e não transacionais), e, portanto, definem as várias entidades que são tocadas pelo negócios

Em sua maioria, os Master Data (Data é plural de Datum) são dados que sofrem nenhuma ou pouquíssima alteração em função do tempo. Master Data representa o core (núcelo duro) de um negócio, corporação, entidade.

Variavelmente, em função do tamanho da organização, os dados de entidades podem estar replicados, redundantes, isolados e não interligados em várias bases de dados distintas, e, servindo à aplicações diferentes. Aí reside um problema para MDM – Master Data Management.

Master Data pode ser dividido em 4 grandes categorias:

  • Pessoas: Clientes, Fornecedores, Parceiros, etc;
  • Localidades: Matriz, Filiais, Cidades, Estados, Endereços, etc;
  • Coisas: Produtos, Serviços, etc;
  • Organizacionais: Estrutura organizacional, vendas regionalizadas, centros de custo, plano de contas, listas de preços, etc;

Notem que não é possível fazer uma venda se não tivermos a “coisa” Produto e uma pessoa “cliente”. Não é possível imaginar uma campanha e/ou iniciativa de marketing se não soubermos em quais “localidades” ela irá ocorrer e quais são as “pessoas” alvo, e, mais, quais “coisas” (produtos ou serviços) serão ofertados, e, qual “lista de preço” será praticada.

Os dados transacionais ou movimentos não são considerados como dados mestres (master data), embora, tenham igual importância, pois podem ser utilizados para geração de conhecimento (BI – Business Inteligence). Mas, é fato que uma empresa poderia “rodar” sem os dados transacionais, mas, jamais sem seus dados mestres. Dados transacionais, para efeito de exemplo, são: orçamentos, pedidos/vendas, pagáveis, recebíveis, movimentações do estoque, etc.

Agora, imagine o seguinte cenário: empresa de médio porte tem um sistema financeiro do fornecedor A, um sistema de vendas do fornecedor B, e, um CRM de C. Neste cenário, é muito provável que os Sistemas de A, B, C, cada qual, tenha seus cadastros de pessoas, localidades, coisas, etc.

É possível, e, até bem provável que se não houver uma integração entre os tais sistemas, os cadastros podem conter informações incoerentes, do tipo:

  • Sistema A: Alexandre de Almeida mora na R das Nacoes Unitas, 3000
  • Sistema B: Alexandre M de Almeida mora na Av NAÇÕES UNIDAS, 3000 – T1 – 😯
  • Sistema C: Alexandre Martinho de Almeida na Av Nações Unidades, 3000 Torre 1 8 Andar

O desafio será quando, em determinado momento, quisermos fazer uma unificação de nossas bases para fins de melhorar a qualidade de nossos dados (Data Quality). Qual será o nosso mestre de dados?

Não faz sentido? Imagine uma empresa de grande porte que tem diversas unidades de negócios, e, que atuam com certa independência, e cada qual com seus sistemas distintos e independentes? Quantos clientes Alexandre Martinho de Almeida haveriam espalhados por estas bases? Imagine o caos que seria traçar uma campanha de marketing, afim de garantir que eu não ligasse dezena de vezes para o mesmo prospect?

Vou dar um exemplo, que particularmente, me incomoda. Sou cliente de uma certa operadora. E pior, sou cliente de telefonia fixa, telefonia móvel, internet de banda larga, TV por assinatura e, infelizmente, 3G para tablet.

Pois bem. As cobranças vão para endereços diferentes, e, juro que já tentei deixar meu nome completo e correto em todas. Mas, é impossível. Eles até tentam, mas, não sabem quais produtos me oferecer, qual o relacionamento total que tenho com eles. Um verdadeiro caos. Se tivessem uma base mestre, base unificada, Master Data (como queiram chamar), isto jamais aconteceria. Certamente, saberiam quem eu sou, onde moro, como me contactar, qual o nível de relacionamento, quais produtos oferecer.

Indo mais longe, em um cenário de aquisições, empresas comprando empresas, imaginem o desafio de ter os dados mestres unificados de forma confiável afim de dar sustentação a toda uma corporação.

Master Data tem sua importância exponencialmente aumentada em função do porte da empresa, de quantidade de produtos inter-relacionados, unidades de negócios independentes, etc.

Para criarmos um banco mestre (Master Data) perfeito precisamos observar os critérios de MDM/DQ, afim de fazer a unificação de todas os 4 grupos de dados descritos acima. Quando desta unificação, que passará por processos de higienização, deduplicação, padronização e validadação, escolheremos através de algoritmos qual o melhor “nome” de um pessoa, e, seu endereço, qual o documento válido. Após este processo, aí sim, teremos uma base de dados consistente e confiável, o nosso Master Data.