{{sellerTotalView > 1 ? __("sellers", {number: sellerTotalView}) : __("seller", {number: sellerTotalView}) }}, {{numTotalView > 1 ? __("items", {number: numTotalView}) : __("item", {number: numTotalView}) }}
免运费
Yami

Nickname

请告诉我们怎么更好地称呼你

更新你的名字
账户 订单 收藏
{{ inviteNavTitle }}
退出登录

切换配送区域

不同区域的库存和配送时效可能存在差异.

历史邮编

{{email ? __('Got it!') : __('Restock Alert')}}

我们将在商品到货后第一时间通知你。

取消
Yami

京东图书

Hadoop实战手册

{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}

Hadoop实战手册

{{__(":people-members", {'people': item.limit_people_count})}} {{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ item.invalid_price }} {{ itemDiscount }}
后结束
{{ itemCurrency }}{{ item.valid_price }}
{{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }}
{{ itemDiscount }}
{{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }} {{ itemCurrency }}{{ item.invalid_price }} {{itemDiscount}}
{{ itemCurrency }}{{ item.valid_price }}
后结束促销
后开始秒杀 后结束秒杀
{{ getSeckillDesc(item.seckill_data) }}
{{ __( "Pay with Gift Card to get sale price: :itemCurrency:price", { 'itemCurrency' : itemCurrency, 'price' : (item.giftcard_price ? priceFormat(item.giftcard_price) : '0.00') } ) }} ({{ itemCurrency }}{{ priceFormat(item.giftcard_price / item.bundle_specification) }}/{{ item.unit }}) 详情
商品有效期

已下架

当前地址无法配送
已售完

商品描述

展开全部描述
内容简介

这是一本Hadoop实用手册,主要针对实际问题给出相应的解决方案。《Hadoop实战手册》特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS的概述、Pig与Hive的使用、ETL和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍Hadoop的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。
《Hadoop实战手册》适合各个层次的Hadoop技术人员阅读。通过阅读《Hadoop实战手册》,Hadoop初学者可以使用Hadoop来进行数据处理,Hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,Hadoop系统管理员可以更好地进行日常运维。《Hadoop实战手册》也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。
作者简介

Jonathan R.Owens:软件工程师,拥有Java和C++技术背景,最近主要从事Hadoop及相关分布式处理技术工作。目前就职于comScore公司,为核心数据处理团队成员。comScore是一家知名的从事数字测量与分析的公司,公司使用Hadoop及其他定制的分布式系统对数据进行聚合、分析和管理,每天处理超过400亿单的交易。 Jon Lentz:comScore核心数据处理团队软件工程师。他更倾向于使用Pig脚本来解决问题。在加入comScore之前,他主要开发优化供应链和分配固定收益证券的软件。 Brian Femiano:本科毕业于计算机科学专业,并且从事相关专业软件开发工作6年,最近两年主要利用Hadoop构建高级分析与大数据存储。他拥有商业领域的相关经验,以及丰富的政府合作经验。他目前就职于Potomac Fusion公司,这家公司主要从事可扩展算法的开发,并致力于学习并改进政府领域中最先进和最复杂的数据集。他通过教授课程和会议培训在公司内部普及Hadoop和云计算相关的技术。
目录

目录

第1章Hadoop分布式文件系统——导入和导出数据1
1.1介绍1
1.2使用Hadoop shell命令导入和导出数据到HDFS2
1.3使用distcp实现集群间数据复制7
1.4使用Sqoop从MySQL数据库导入数据到HDFS9
1.5使用Sqoop从HDFS导出数据到MySQL12
1.6配置Sqoop以支持SQL Server15
1.7从HDFS导出数据到MongoDB17
1.8从MongoDB导入数据到HDFS20
1.9使用Pig从HDFS导出数据到MongoDB23
1.10在Greenplum外部表中使用HDFS24
1.11利用Flume加载数据到HDFS中26

第2章HDFS28
2.1介绍28
2.2读写HDFS数据29
2.3使用LZO压缩数据31
2.4读写序列化文件数据34
2.5使用Avro序列化数据37
2.6使用Thrift序列化数据41
2.7使用Protocol Buffers序列化数据44
2.8设置HDFS备份因子48
2.9设置HDFS块大小49

第3章抽取和转换数据51
3.1介绍51
3.2使用MapReduce将Apache日志转换为TSV格式52
3.3使用Apache Pig过滤网络服务器日志中的爬虫访问量54
3.4使用Apache Pig根据时间戳对网络服务器日志数据排序57
3.5使用Apache Pig对网络服务器日志进行会话分析59
3.6通过Python扩展Apache Pig的功能61
3.7使用MapReduce及二次排序计算页面访问量62
3.8使用Hive和Python清洗、转换地理事件数据67
3.9使用Python和Hadoop Streaming执行时间序列分析71
3.10在MapReduce中利用MultipleOutputs输出多个文件75
3.11创建用户自定义的Hadoop Writable及InputFormat读取地理事件数据78

第4章使用Hive、Pig和MapReduce处理常见的任务85
4.1介绍85
4.2使用Hive将HDFS中的网络日志数据映射为外部表86
4.3使用Hive动态地为网络日志查询结果创建Hive表87
4.4利用Hive字符串UDF拼接网络日志数据的各个字段89
4.5使用Hive截取网络日志的IP字段并确定其对应的国家92
4.6使用MapReduce对新闻档案数据生成n-gram94
4.7通过MapReduce使用分布式缓存查找新闻档案数据中包含关键词的行98
4.8使用Pig加载一个表并执行包含GROUP BY的SELECT操作102

第5章高级连接操作104
5.1介绍104
5.2使用MapReduce对数据进行连接104
5.3使用Apache Pig对数据进行复制连接108
5.4使用Apache Pig对有序数据进行归并连接110
5.5使用Apache Pig对倾斜数据进行倾斜连接111
5.6在Apache Hive中通过map端连接对地理事件进行分析113
5.7在Apache Hive通过优化的全外连接分析地理事件数据115
5.8使用外部键值存储(Redis)连接数据118

第6章大数据分析123
6.1介绍123
6.2使用MapReduce和Combiner统计网络日志数据集中的独立IP数124
6.3运用Hive日期UDF对地理事件数据集中的时间日期进行转换与排序129
6.4使用Hive创建基于地理事件数据的每月死亡报告131
6.5实现Hive用户自定义UDF用于确认地理事件数据的来源可靠性133
6.6使用Hive的map/reduce操作以及Python标记最长的无暴力发生的时间区间136
6.7使用Pig计算Audioscrobbler数据集中艺术家之间的余弦相似度141
6.8使用Pig以及datafu剔除Audioscrobbler数据集中的离群值145

第7章高级大数据分析147
7.1介绍147
7.2使用Apache Giraph计算PageRank147
7.3使用Apache Giraph计算单源最短路径150
7.4使用Apache Giraph执行分布式宽度优先搜索158
7.5使用Apache Mahout计算协同过滤165
7.6使用Apache Mahout进行聚类168
7.7使用Apache Mahout进行情感分类171

第8章调试174
8.1介绍174
8.2在MapReduce中使用Counters监测异常记录174
8.3使用MRUnit开发和测试MapReduce177
8.4本地模式下开发和测试MapReduce179
8.5运行MapReduce作业跳过异常记录182
8.6在流计算作业中使用Counters184
8.7更改任务状态显示调试信息185
8.8使用illustrate调试Pig作业187

第9章系统管理189
9.1介绍189
9.2在伪分布模式下启动Hadoop189
9.3在分布式模式下启动Hadoop192
9.4添加一个新节点195
9.5节点安全退役197
9.6NameNode故障恢复198
9.7使用Ganglia监控集群199
9.8MapReduce作业参数调优201

第10章使用Apache Accumulo进行持久化204
10.1介绍204
10.2在Accumulo中设计行键存储地理事件205
10.3使用MapReduce批量导入地理事件数据到Accumulo213
10.4设置自定义字段约束Accumulo中的地理事件数据220
10.5使用正则过滤器限制查询结果225
10.6使用SumCombiner计算同一个键的不同版本的死亡数总和228
10.7使用Accumulo实行单元级安全的扫描232
10.8使用MapReduce聚集Accumulo中的消息源237

规格参数

品牌 京东图书
品牌属地 中国
ISBN 9787115337955
著者 [美]Jonathan R. Owens,Jon Lentz,Brian Femiano
出版社 人民邮电出版社
用纸 胶版纸
包装 平装
出版时间 2014-03-01
页数 242
译者 傅杰,赵磊,卢学裕
语言 中文
版次 01

免责声明

产品价格、包装、规格等信息如有调整,恕不另行通知。我们尽量做到及时更新产品信息,但请以收到实物为准。使用产品前,请始终阅读产品随附的标签、警告及说明。

查看详情
加入收藏
{{ $isZh ? coupon.coupon_name_sub : coupon.coupon_ename_sub | formatCurrency }}
{{__("Buy Directly")}} {{ itemCurrency }}{{ item.directly_price }}
数量
{{ quantity }}
{{ instockMsg }}
{{ limitText }}
{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}
由 京东图书 销售
送至
{{ __("Ship to United States only") }}
满$69免运费
正品保证

已加入购物车

继续逛逛

为你推荐

{{ item.brand_name }}

{{ item.item_name }}

{{ item.currency }}{{ item.market_price }}

{{ item.currency }}{{ item.unit_price }}

{{ item.currency }}{{ item.unit_price }}

优惠券

{{ coupon.coupon_name_new | formatCurrency }}
领取 已领取 已领完
{{ getCouponDescStr(coupon) }}
{{ coupon.use_time_desc }}
即将过期: {{ formatTime(coupon.use_end_time) }}

分享给好友

取消

亚米礼卡专享价

使用礼卡支付即可获得礼卡专享价

规则说明

礼卡专享价是部分商品拥有的特殊优惠价格;

购买礼卡专享价商品时,若在结算时使用电子礼卡抵扣支付,且礼卡余额足够支付订单中所有礼卡专享价商品的专享价总和,则可以启用礼卡专享价;

不使用礼卡支付,或礼卡余额不满足上一条所述要求时,将无法启用礼卡专享价,按照普通售价计算,但您仍然可以购买这些商品;

在购买礼卡专享价商品时,若余额不足,可以在购物车或结算页中点击“充值”按钮对礼卡进行购买和充值;

商品若拥有礼卡专享价,会显示“专享”的特殊价格标记;

如有疑问,请随时联系客服;

礼卡专享价相关规则最终解释权归亚米所有。

由 亚米 销售

服务保障

Yami 满$49免运费
Yami 无忧退换
Yami 从美国发货

配送信息

  • 美国

    标准配送 $5.99(不包含阿拉斯加,夏威夷),最终价满$49免运费

    本地配送$5.99(加州,纽约州,新泽西,麻省和宾夕法尼亚,以上州部分地区);最终价满$49免运费

    两日达(包含阿拉斯加夏威夷)运费$19.99起

退换政策

亚米网希望为我们的客户提供最优秀的售后服务,让所有人都能放心在亚米购物。亚米自营商品在满足退换货条件的情况下,可在收到包裹的30天之内退换商品(食品因商品质量问题7天内可退换;为了确保每位客户都能获得安全和高质量的商品,对于美妆类产品,一经开封或使用即不提供退款或退货服务,质量问题除外;其他特殊商品需联系客服咨询)。
感谢您的理解和支持。

查看详情

由 亚米 销售

亚米电子礼品卡使用规则

若购买时选择自动充值,订单完成后礼卡将自动充值到您的账户中;

若购买时选择发送邮件,订单完成后系统将自动发送卡号和密码到您填写的邮箱;

发送邮件时,任何用户均可使用邮件中的卡号密码进行礼卡充值,请妥善保管邮件信息。

如接收邮件遇到问题,请联系客服处理;

发送邮件时,若礼卡没有被兑换,可以补发邮件。若已经被其他用户兑换,则无法补偿;

亚米网电子礼卡可用于购买自营或第三方商品;

亚米网电子礼卡没有有效期限制,长期有效;

亚米网电子礼卡的金额,可分多次使用;

亚米网电子礼卡业务规则,最终解释权归亚米网所有。

退换政策

已消费的电子礼卡不支持退款。

京东图书 销售

服务保障

Yami 满$49免运费
Yami 最优售后
Yami 美国本土发货

配送信息

  • 美国

    标准配送 $5.99(不包含阿拉斯加,夏威夷),最终价满$49免运费

    本地配送$5.99(加州,纽约州,新泽西,麻省和宾夕法尼亚,以上州部分地区);最终价满$49免运费

    两日达(包含阿拉斯加夏威夷)运费$19.99起

退换政策

提供30天内退还保障。产品需全新未使用原包装内,并附有购买凭据。产品质量问题、或错发漏发等,由商家造成的失误,将进行补发,或退款处理。其它原因需退货费用由客户自行承担。

由 京东图书 销售

服务保障

Yami 跨店满$69免运费
Yami 30天退换保障

亚米-中国集运仓

由亚米从中国精选并集合各大优秀店铺的商品至亚米中国整合中心,合并包裹后将一次合包跨国邮寄至您的地址。跨店铺包邮门槛低至$69。您将在多商家集合提供的广泛选品中选购商品,轻松享受跨店铺包邮后的低邮费。

退换政策

提供30天内退换保障。产品需在全新未使用的原包装内,并附有购买凭据。产品质量问题、错发、或漏发等由商家造成的失误,将进行退款处理。其它原因造成的退换货邮费客户将需要自行承担。由于所有商品均长途跋涉,偶有简易外包压磨等但不涉及内部质量问题者,不予退换。

配送信息

亚米中国集运 Consolidated Shipping 运费$9.99(订单满$69 包邮)

下单后2个工作日中国商家发货,所有包裹抵达亚米中国整合中心(除特别情况及中国境内个别法定节假日外)会合并包裹后通过UPS发往美国。UPS从中国发货后到美国境内的平均时间为10个工作日左右,根据直发单号可随时跟踪查询。受疫情影响,目前物流可能延迟5天左右。包裹需要客人签收。如未签收,客人须承担包裹丢失风险。

由 京东图书 销售

服务保障

满$69免运费
正品保证

配送信息

Yami Consolidated Shipping 运费$9.99(订单满$69包邮)


下单后1-2个工作日内发货。 物流时效预计7-15个工作日。 如遇清关,交货时间将延长3-7天。 最终收货日期以邮政公司信息为准。

积分规则

不参加任何折扣活动以及亚米会员积分制度。

退换政策

提供30天内退还保障。产品需全新未使用原包装内,并附有购买凭据。产品质量问题、或错发漏发等,由商家造成的失误,将进行补发,或退款处理。其它原因需退货费用由客户自行承担。

Yami

下载亚米应用

返回顶部

为你推荐

品牌故事

京东图书

为您推荐

Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折

评论{{'('+ commentList.posts_count + ')'}}

分享你的感受,帮助更多用户做出选择。

写评论
{{ totalRating }} 写评论
  • {{i}}星

    {{i}}星

    {{ parseInt(commentRatingList[i]) }}%

Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已购买 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}
Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已购买 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}

暂无符合条件的评论

评论详情

Yami Yami

{{ showTranslate(commentDetails) }}收起

{{ strLimit(commentDetails,800) }}查看全部

Show Original

{{ commentDetails.content }}

Yami
查看更多

{{ formatTime(commentDetails.in_dtm) }} 已购买 {{groupData}}

{{ commentDetails.likes_count }} {{ commentDetails.likes_count }} {{ commentDetails.reply_count }} {{commentDetails.in_user==uid ? __('Delete') : __('Report')}}

请输入内容

回复{{'(' + replyList.length + ')'}}

Yami Yami

{{ showTranslate(reply) }}收起

{{ strLimit(reply,800) }}查看全部

Show Original

{{ reply.reply_content }}

{{ formatTime(reply.reply_in_dtm) }}

{{ reply.reply_likes_count }} {{ reply.reply_likes_count }} {{ reply.reply_reply_count }} {{reply.reply_in_user==uid ? __('Delete') : __('Report')}}

请输入内容

取消

End

发表评论
商品评分

请输入评论

  • 一个好的昵称,会让你的评论更受欢迎!
  • 修改了这里的昵称,个人资料中的昵称也将被修改。
感谢你的评论
你的好评可以帮助我们的社区发现更好的亚洲商品。

举报

取消

确认删除该评论吗?

取消

历史浏览

品牌故事

京东图书