商品簡介
Hadoop, otwarta implementacja frameworka Map/Reduce oparta na języku Java, stworzona przez Apache Software Foundation, to framework obliczeniowy przeznaczony do obslugi aplikacji rozproszonych przetwarzających duże ilości danych. Zapewnia narzędzia do przetwarzania ogromnych ilości danych przy użyciu frameworka Map/Reduce, a dodatkowo implementuje rozproszony system plik闚 podobny do systemu plik闚 Google. Może byc używany do przetwarzania ogromnych ilości danych r闚nolegle na dużych klastrach w spos鏏 niezawodny i odporny na awarie. Od dawna Java jest używana przez wielu programist闚 do przetwarzania danych. W tej książce por闚naliśmy i przeanalizowaliśmy wydajnośc Hadoop z Java, Hadoop z Hadoop Optimize oraz Hadoop Optimize z Java pod kątem r?#380;nych kryteri闚 wydajności, takich jak przetwarzanie (wykorzystanie procesora), przechowywanie i efektywnośc podczas przetwarzania danych. Wyniki naszych eksperyment闚 pokazują poprawę czasu wykonania przy użyciu zoptymalizowanego algorytmu Map/Reduce. Por闚nując Hadoop i Java, Hadoop jest lepszy, gdy mamy klaster wielowęzlowy i duży rozmiar danych. Jednak gdy mamy pojedynczy węzel i maly rozmiar danych, nawet Java może dzialac lepiej.