Arquivo da categoria: Data Quality

Data Quality: Death Index – Prevenção de Fraudes

Dentre as aplicações mais buscadas ao se instituir um serviço de Data Quality é, sem dúvida, a prevenção de fraudes. A fraude é sem dúvida, um ponto de atenção para grandes corporações no mundo todo. Uma base dados de alta qualidade, torna-se o motor e a base para criação de um sistema anti-fraude impecável.

Tem crescido no mundo inteiro (no Brasil os números são de dificil acesso, quando sequer existem) uma fraude, bastante, tradicional: a apropriação da identidade de falecidos. Segundo a ACFE (Association of Certification Fraud Examiners) este número cresce por volta de 12% ao ano (não há indicadores para o Brasil).

No que consiste esta fraude? Simples. Imagine um cidadão de bem, que trabalhou toda uma vida. Constituiu família, um cadastro positivo em diversas instituições, bens móveis e imóveis. Quando, de repente, na plenitude de sua vida, vem a óbito aos 50 anos de idade. A família aturdida e as instituições que mal tomam conta dos cidadãos vivos, quem dirá dos mortos.

Continue lendo Data Quality: Death Index – Prevenção de Fraudes

O BI sem data quality não tem tanta “intelligence” nem serve ao “business”

Temos a tendência em acreditar que tudo é novidade na área da tecnologia da informação. Nós, os mais “antigos” temos vistos temas sendo revisitados e relançados. Assim como na moda, a área de TI abandona algumas tecnologias para anos depois, relança-las com alguma roupagem nova e/ou releitura. E mais, em TI, temos a indiscreta mania de fazer isso com nomes pomposos, estrangeiros, e, se for sigla então, fica parecendo mais novidade ainda!

Pois bem, com Data Quality não seria diferente. Muitas empresas ao redor do globo já praticam alguma forma de DQ. Lembrando, que existem níveis de maturação de empresas, pessoas, processos e dos próprio dados, quando falamos de DQ.

Por exemplo, qualquer pré-checagem de dados, na sua entrada (na digitação mesmo), ou, uma verificação (constraint) na coluna de uma tabela do RDBMS já é um passo em direção ao DQ.

Continue lendo O BI sem data quality não tem tanta “intelligence” nem serve ao “business”

Qual a diferença entre ETL e MDM?


MDM
ETL é um velho conhecido. ETL significa Extract – Transform – Load, ou, em “bom quase bom português”: Extrair, Transformar e Carregar. Nos últimos anos alguns “vendors” (fabricantes), notadamente, a IBM, tem aparecido com “várias variações”, tais como: TEL e T-ETL, por exemplo. Mas, no fundo “ETL” em que pese o significado de suas “letrinhas combinadas” é um processo de migração, de transporte de dados.

 O objetivo máximo de uma ferramenta de ETL é transportar dados de uma ou mais fontes de origem (A) para um destino (B). Normalmente, (A) é uma banco de dados relacional e/ou arquivos texto (xml, csv, “plain text”). E, o destino ou (B), geralmente, é um Data Mart ou Data Warehouse (banco de dados relacional, NoSQL, BigData, etc). Obviamente, existem outros usos mais específicos (e até mais bacanas) para ETL.

Continue lendo Qual a diferença entre ETL e MDM?