清华大学出版社

分类: best365提现多久到账 时间: 2025-08-18 14:34:56 作者: admin

本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共14章,3个附录,涉及的主题包括:Haddoop简介;MapReduce简介;Hadoop分布式文件系统;Hadoop的I/O、MapReduce应用程序开发;MapReduce的工作机制;MapReduce的类型和格式;MapReduce的特性;如何安装Hadoop集群,如何管理Hadoop;Pig简介;Hbase简介;ZooKeeper简介,最后还提供了丰富的案例分析。

本书是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。

前 言

马丁·加德纳(数学家和科学作家),曾经在一次采访中说道:

“没有微积分,我的生命就失去了意义。这是我成功的秘诀。我花了如此长的时间了解我在写什么,所以我知道如何写作才能让大多数读者明白我的意思。”

在许多方面,这就是我对Hadoop的感觉。它的内部工作机制是复杂的、相互依赖的,因为它运行在分布式系统的理论、实用技术和技术常识这些复杂的基础之上。对于门外汉来说,Hadoop就像是异形一样难以理解。

但事实上并不是这样的。剥离其核心,Hadoop提供给组件分布式系统的工具——如数据存储、数据分析和协调——是十分简单的。如果有一个共同的主题,那么它将与提高抽象水平相关的——为程序员创建用于处理这些事情的基础架构,这些程序员中,或者正好有大量数据需要存储,或者有大量数据需要分析,或者有大量机器需要协调,或者没有时间、技能或兴趣成为分布式系统专家。

借由这样一个简单的、普遍适用的功能组合,在开始使用这个理当被广泛普及的Hadoop的时候,我的想法逐渐清晰起来。然而,在当时(2006年初),设置、配置和编写程序来使用Hadoop称得上是一门艺术。幸运的是,此后有了明显的进步,因为有更多的文件,更多的例子,一旦有疑问,还有那么多邮件地址可以发过去帮助你解惑。但对大多数新手来说,最大的障碍是理解这项技术能做什么,它的长处何在,如何使用它。这就是我写这...

暂无课件

样章下载

暂无网络资源

版权信息

扫描二维码下载APP了解更多