商品簡介
O Hadoop, a implementa誽o de c鏚igo aberto e baseada em Java da Apache Software Foundation da estrutura Map/Reduce, ?uma estrutura de computa誽o distribu獮a projetada para aplica踥es distribu獮as com uso intensivo de dados. Ele fornece as ferramentas para processar grandes quantidades de dados usando a estrutura Map/Reduce e, al幦 disso, implementa um sistema de ficheiros distribu獮o semelhante ao sistema de ficheiros do Google. Pode ser usado para processar grandes quantidades de dados em paralelo em grandes clusters de maneira confi嫛el e tolerante a falhas. H?muito tempo que o Java ?utilizado por muitos programadores para processar dados. Neste livro, comparamos e analisamos o desempenho do Hadoop com o Java, do Hadoop com o Hadoop Optimize e do Hadoop Optimize com o Java em termos de diferentes crit廨ios de desempenho, tais como processamento (utiliza誽o da CPU), armazenamento e efici瘽cia no processamento de dados. Os nossos resultados experimentais mostram uma melhoria no tempo de execu誽o ao utilizar o algoritmo Map/Reduce otimizado. Na compara誽o entre o Hadoop e o Java, o Hadoop ?melhor quando temos um cluster de v嫫ios n鏀 e o tamanho dos dados ?grande. No entanto, quando temos um ico n?e um tamanho de dados pequeno, at?mesmo o Java pode ter um desempenho melhor.