Arquivo da categoria: Hadoop

O que é Hadoop?

Acho que a melhor resposta é: Hadoop é o elefantinho desengonçado aí do lado. E de fato é. Quem está acostumado a assistir minhas aulas e palestras, deve estar pensando “o titio já está de sacanagem”. Não, não estou. Garanto. Este elefantinho aí ao lado, é do filho de Doug Cutting, criador do “Hadoop” (na verdade o filho dele é quem o criou). Doug decidiu usar este nome por ser de simples pronunciação, divertido, e acima de tudo único (acho que ninguém além de seu filhinho conhecia o que era um hadoop). Ser único tem uma vantagem astronômica nos dias googlianos! É facilmente localizável nas ferramentas de busca.

Agora, também podemos dizer que Hadoop é uma nova forma de armazenar e manipular grandes bancos de dados, sejam estes normalizados ou não. Na verdade, dentro do universo hadoop, sequer precisamos organizar os bancos de dados em tabelas, como faríamos num RDBMS tradicional

Hadoop não é para todos! Hadoop encontra sua existência em grandes bases de dados. E vamos combinar, nada menor que 1TB deve ser considerado grande nestes dias de Big Data.

Continue lendo O que é Hadoop?