{{sellerTotalView > 1 ? __("sellers", {number: sellerTotalView}) : __("seller", {number: sellerTotalView}) }}, {{numTotalView > 1 ? __("items", {number: numTotalView}) : __("item", {number: numTotalView}) }}
免运费
Yami

Nickname

请告诉我们怎么更好地称呼你

更新你的名字
账户 订单 收藏
{{ inviteNavTitle }}
退出登录

切换配送区域

不同区域的库存和配送时效可能存在差异.

历史邮编

{{email ? __('Got it!') : __('Restock Alert')}}

我们将在商品到货后第一时间通知你。

取消
Yami

京东图书

Spark MLlib机器学习:算法、源码及实战详解

{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}

Spark MLlib机器学习:算法、源码及实战详解

{{__(":people-members", {'people': item.limit_people_count})}} {{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ item.invalid_price }} {{ itemDiscount }}
后结束
{{ itemCurrency }}{{ item.valid_price }}
{{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }}
{{ itemDiscount }}
{{ itemCurrency }}{{ item.valid_price }} {{ itemCurrency }}{{ priceFormat(item.valid_price / item.bundle_specification) }}/{{ item.unit }} {{ itemCurrency }}{{ item.invalid_price }} {{itemDiscount}}
{{ itemCurrency }}{{ item.valid_price }}
后结束促销
后开始秒杀 后结束秒杀
{{ getSeckillDesc(item.seckill_data) }}
{{ __( "Pay with Gift Card to get sale price: :itemCurrency:price", { 'itemCurrency' : itemCurrency, 'price' : (item.giftcard_price ? priceFormat(item.giftcard_price) : '0.00') } ) }} ({{ itemCurrency }}{{ priceFormat(item.giftcard_price / item.bundle_specification) }}/{{ item.unit }}) 详情
商品有效期

已下架

当前地址无法配送
已售完

商品描述

展开全部描述
编辑推荐

本书系统、全面、深入地解析了SparkMLlib机器学习的相关知识,着力于探索分布式机器学习的底层实现。
以源码为基础,兼顾算法、理论与实战,帮助读者在实际工作中进行MLlib的应用开发和定制开发。
适合大数据、Spark、数据挖掘领域的从业人员阅读。
内容简介

《Spark MLlib机器学习:算法、源码及实战详解》以Spark 1.4.1版本源码为切入点,全面并且深入地解析Spark MLlib模块,着力于探索分布式机器学习的底层实现。
《Spark MLlib机器学习:算法、源码及实战详解》中本着循序渐进的原则,首先解析MLlib的底层实现基础:数据操作及矩阵向量计算操作,该部分是MLlib实现的基础;接着对各个机器学习算法的理论知识进行讲解,并且解析机器学习算法如何在MLlib中实现分布式计算;然后对MLlib源码进行详细的讲解;最后进行MLlib实例的讲解。相信通过《Spark MLlib机器学习:算法、源码及实战详解》的学习,读者可全面掌握Spark MLlib机器学习,能够进行MLlib实战、MLlib定制开发等。
《Spark MLlib机器学习:算法、源码及实战详解》适合大数据、Spark、数据挖掘领域的从业人员阅读,同时也为Spark开发者和大数据爱好者展现了分布式机器学习的原理和实现细节。
作者简介

黄美灵,久邦数码高级数据挖掘工程师,Spark爱好者,致力于分布式机器学习的研究与应用,现从事移动互联网的计算广告和数据变现工作,专注Spark机器学习在计算广告中的研究和实践。
目录

第一部分Spark MLlib基础
第1章Spark机器学习简介 2
1.1机器学习介绍 2
1.2Spark介绍 3
1.3Spark MLlib介绍 4
第2章Spark数据操作 6
2.1Spark RDD操作 6
2.1.1Spark RDD创建操作 6
2.1.2Spark RDD转换操作 7
2.1.3Spark RDD行动操作 14
2.2MLlib Statistics统计操作 15
2.2.1列统计汇总 15
2.2.2相关系数 16
2.2.3假设检验 18
2.3MLlib数据格式 18
2.3.1数据处理 18
2.3.2生成样本 22
第3章Spark MLlib矩阵向量 26
3.1Breeze介绍 26
3.1.1Breeze创建函数 27
3.1.2Breeze元素访问及操作函数 29
3.1.3Breeze数值计算函数 34
3.1.4Breeze求和函数 35
3.1.5Breeze布尔函数 36
3.1.6Breeze线性代数函数 37
3.1.7Breeze取整函数 39
3.1.8Breeze常量函数 40
3.1.9Breeze复数函数 40
3.1.10Breeze三角函数 40
3.1.11Breeze对数和指数函数 40
3.2BLAS介绍 41
3.2.1BLAS向量-向量运算 42
3.2.2BLAS矩阵-向量运算 42
3.2.3BLAS矩阵-矩阵运算 43
3.3MLlib向量 43
3.3.1MLlib向量介绍 43
3.3.2MLlib Vector接口 44
3.3.3MLlib DenseVector类 46
3.3.4MLlib SparseVector类 49
3.3.5MLlib Vectors伴生对象 50
3.4MLlib矩阵 57
3.4.1MLlib矩阵介绍 57
3.4.2MLlib Matrix接口 57
3.4.3MLlib DenseMatrix类 59
3.4.4MLlib SparseMatrix类 64
3.4.5MLlib Matrix伴生对象 71
3.5MLlib BLAS 77
3.6MLlib分布式矩阵 93
3.6.1MLlib分布式矩阵介绍 93
3.6.2行矩阵(RowMatrix) 94
3.6.3行索引矩阵(IndexedRowMatrix) 96
3.6.4坐标矩阵(CoordinateMatrix) 97
3.6.5分块矩阵(BlockMatrix) 98

第二部分Spark MLlib回归算法
第4章Spark MLlib线性回归算法 102
4.1线性回归算法 102
4.1.1数学模型 102
4.1.2最小二乘法 105
4.1.3梯度下降算法 105
4.2源码分析 106
4.2.1建立线性回归 108
4.2.2模型训练run方法 111
4.2.3权重优化计算 114
4.2.4线性回归模型 121
4.3实例 123
4.3.1训练数据 123
4.3.2实例代码 123
第5章Spark MLlib逻辑回归算法 126
5.1逻辑回归算法 126
5.1.1数学模型 126
5.1.2 梯度下降算法 128
5.1.3正则化 129
5.2源码分析 132
5.2.1建立逻辑回归 134
5.2.2模型训练run方法 137
5.2.3权重优化计算 137
5.2.4逻辑回归模型 144
5.3实例 148
5.3.1训练数据 148
5.3.2实例代码 148
第6章Spark MLlib保序回归算法 151
6.1保序回归算法 151
6.1.1数学模型 151
6.1.2L2保序回归算法 153
6.2源码分析 153
6.2.1建立保序回归 154
6.2.2模型训练run方法 156
6.2.3并行PAV计算 156
6.2.4PAV计算 157
6.2.5保序回归模型 159
6.3实例 164
6.3.1训练数据 164
6.3.2实例代码 164

第三部分Spark MLlib分类算法
第7章Spark MLlib贝叶斯分类算法 170
7.1贝叶斯分类算法 170
7.1.1贝叶斯定理 170
7.1.2朴素贝叶斯分类 171
7.2源码分析 173
7.2.1建立贝叶斯分类 173
7.2.2模型训练run方法 176
7.2.3贝叶斯分类模型 179
7.3实例 181
7.3.1训练数据 181
7.3.2实例代码 182
第8章Spark MLlib SVM支持向量机算法 184
8.1SVM支持向量机算法 184
8.1.1数学模型 184
8.1.2拉格朗日 186
8.2源码分析 189
8.2.1建立线性SVM分类 191
8.2.2模型训练run方法 194
8.2.3权重优化计算 194
8.2.4线性SVM分类模型 196
8.3实例 199
8.3.1训练数据 199
8.3.2实例代码 199
第9章Spark MLlib决策树算法 202
9.1决策树算法 202
9.1.1决策树 202
9.1.2特征选择 203
9.1.3决策树生成 205
9.1.4决策树生成实例 206
9.1.5决策树的剪枝 208
9.2源码分析 209
9.2.1建立决策树 211
9.2.2建立随机森林 216
9.2.3建立元数据 220
9.2.4查找特征的分裂及划分 223
9.2.5查找最好的分裂顺序 228
9.2.6决策树模型 231
9.3实例 234
9.3.1训练数据 234
9.3.2实例代码 234

第四部分Spark MLlib聚类算法
第10章Spark MLlib KMeans聚类算法 238
10.1KMeans聚类算法 238
10.1.1KMeans算法 238
10.1.2演示KMeans算法 239
10.1.3初始化聚类中心点 239
10.2源码分析 240
10.2.1建立KMeans聚类 242
10.2.2模型训练run方法 247
10.2.3聚类中心点计算 248
10.2.4中心点初始化 251
10.2.5快速距离计算 254
10.2.6KMeans聚类模型 255
10.3实例 258
10.3.1训练数据 258
10.3.2实例代码 259
第11章Spark MLlib LDA主题模型算法 261
11.1LDA主题模型算法 261
11.1.1LDA概述 261
11.1.2LDA概率统计基础 262
11.1.3LDA数学模型 264
11.2GraphX基础 267
11.3源码分析 270
11.3.1建立LDA主题模型 272
11.3.2优化计算 279
11.3.3LDA模型 283
11.4实例 288
11.4.1训练数据 288
11.4.2实例代码 288

第五部分Spark MLlib关联规则挖掘算法
第12章Spark MLlib FPGrowth关联规则算法 292
12.1FPGrowth关联规则算法 292
12.1.1基本概念 292
12.1.2FPGrowth算法 293
12.1.3演示FP树构建 294
12.1.4演示FP树挖掘 296
12.2源码分析 298
12.2.1FPGrowth类 298
12.2.2关联规则挖掘 300
12.2.3FPTree类 303
12.2.4FPGrowthModel类 306
12.3实例 306
12.3.1训练数据 306
12.3.2实例代码 306

第六部分Spark MLlib推荐算法
第13章Spark MLlib ALS交替最小二乘算法 310
13.1ALS交替最小二乘算法 310
13.2源码分析 312
13.2.1建立ALS 314
13.2.2矩阵分解计算 322
13.2.3ALS模型 329
13.3实例 334
13.3.1训练数据 334
13.3.2实例代码 334
第14章Spark MLlib协同过滤推荐算法 337
14.1协同过滤推荐算法 337
14.1.1协同过滤推荐概述 337
14.1.2用户评分 338
14.1.3相似度计算 338
14.1.4推荐计算 340
14.2协同推荐算法实现 341
14.2.1相似度计算 344
14.2.2协同推荐计算 348
14.3实例 350
14.3.1训练数据 350
14.3.2实例代码 350

第七部分Spark MLlib神经网络算法
第15章Spark MLlib神经网络算法综述 354
15.1人工神经网络算法 354
15.1.1神经元 354
15.1.2神经网络模型 355
15.1.3 信号前向传播 356
15.1.4误差反向传播 357
15.1.5其他参数 360
15.2神经网络算法实现 361
15.2.1神经网络类 363
15.2.2训练准备 370
15.2.3前向传播 375
15.2.4误差反向传播 377
15.2.5权重更新 381
15.2.6ANN模型 382
15.3实例 384
15.3.1测试数据 384
15.3.2测试函数代码 387
15.3.3实例代码 388

前言/序言

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科,其中大部分理论来源于18、19世纪,例如贝叶斯定理,是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出的重要概率论理论;而21世纪则侧重于如何将机器学习理论运用在工业化中,帮助改进性能及提升其效率。
机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。在算法设计方面,机器学习理论关注可以实现的、行之有效的学习算法;机器学习研究的不是求解精确的结果,而是研究开发容易处理的近似求解算法。尤其是在21世纪,知识和数据量爆发的时代,机器学习面临大数据的求解难题。
随着数据量的增加,从传统的单机计算发展到大规模的集群计算,以至发展到今天的一种大规模、快速计算的集群平台—Apache Spark。Spark是一个开源集群运算框架,最初由加州大学伯克利分校AMP实验室开发。相对于Hadoop的MapReduce会在执行完工作后将中介资料存放到磁盘中,Spark使用了内存内运算技术,能在资料尚未写入硬盘时即在内存内分析运算。Spark在内存上的运算速度比Hadoop MapReduce的运算速度快100倍,即便是在磁盘上运行也能快10倍。Spark允许将数据加载至集群内存,并多次对其进行查询,非常适合用于机器学习算法。
本书侧重讲解Spark MLlib模块。Spark MLlib是一种高效、快速、可扩展的分布式计算框架,实现了常用的机器学习,如聚类、分类、回归等算法。本文循序渐进,从Spark的基础知识、矩阵向量的基础知识开始,然后再讲解各种算法的理论知识,以及Spark源码实现和实例实战,帮助读者从基础到实践全面掌握Spark MLlib分布式机器学习。
学习本书需要的基础知识包括:Spark基础入门、Scala入门、线性代数基础知识。
本书面向的读者:Spark开发者、大数据工程师、数据挖掘工程师、机器学习工程师、研究生和高年级本科生等。
在本书的编写过程中,何娟、何丹、王蒙、叶月媚参与了全书的编写、整理及校对工作,刘程辉、李俊、廖宏参与了Spark集群运维和第2章数据操作的实例部分工作,刘晓宏、方佳武、于善龙参与了全书的实例部分工作。
本书在写作的过程中,得到了很多朋友及同事的帮助和支持,在此表示衷心感谢!
感谢久邦数码大数据团队的同事们。在两年的工作中,笔者得到了很多同事的指导、支持和帮助,尤其感谢杨树清、周小平、梁宁、刘程辉、刘晓宏、方佳武、于善龙、王蒙、叶月媚、廖宏、谭钊承、吴梦玲、邹桂芳、曹越等。
感谢电子工业出版社的付睿编辑,她不仅积极策划和推动本书的出版,而且在写作过程中还给出了极为详细的改进意见。感谢电子工业出版社的李云静编辑为本书做了非常辛苦和专业的编辑工作。
感谢我的父母和妻子,有了你们的帮助和支持,我才有时间和精力去完成写作。
谨以此书献给热爱大数据技术的朋友们!

规格参数

品牌 京东图书
品牌属地 中国
ISBN 9787121282140
著者 黄美灵
出版社 电子工业出版社
印刷时间 2016-03-01
用纸 胶版纸
包装 平装
出版时间 2016-03-01
页数 404
语言 中文
版次 1

免责声明

产品价格、包装、规格等信息如有调整,恕不另行通知。我们尽量做到及时更新产品信息,但请以收到实物为准。使用产品前,请始终阅读产品随附的标签、警告及说明。

查看详情
加入收藏
{{ $isZh ? coupon.coupon_name_sub : coupon.coupon_ename_sub | formatCurrency }}
{{__("Buy Directly")}} {{ itemCurrency }}{{ item.directly_price }}
数量
{{ quantity }}
{{ instockMsg }}
{{ limitText }}
{{buttonTypePin == 3 ? __("Scan to view more PinGo") : __("Scan to start")}}
由 京东图书 销售
送至
{{ __("Ship to United States only") }}
满$69免运费
正品保证

已加入购物车

继续逛逛

为你推荐

{{ item.brand_name }}

{{ item.item_name }}

{{ item.currency }}{{ item.market_price }}

{{ item.currency }}{{ item.unit_price }}

{{ item.currency }}{{ item.unit_price }}

优惠券

{{ coupon.coupon_name_new | formatCurrency }}
领取 已领取 已领完
{{ getCouponDescStr(coupon) }}
{{ coupon.use_time_desc }}
即将过期: {{ formatTime(coupon.use_end_time) }}

分享给好友

取消

亚米礼卡专享价

使用礼卡支付即可获得礼卡专享价

规则说明

礼卡专享价是部分商品拥有的特殊优惠价格;

购买礼卡专享价商品时,若在结算时使用电子礼卡抵扣支付,且礼卡余额足够支付订单中所有礼卡专享价商品的专享价总和,则可以启用礼卡专享价;

不使用礼卡支付,或礼卡余额不满足上一条所述要求时,将无法启用礼卡专享价,按照普通售价计算,但您仍然可以购买这些商品;

在购买礼卡专享价商品时,若余额不足,可以在购物车或结算页中点击“充值”按钮对礼卡进行购买和充值;

商品若拥有礼卡专享价,会显示“专享”的特殊价格标记;

如有疑问,请随时联系客服;

礼卡专享价相关规则最终解释权归亚米所有。

由 亚米 销售

服务保障

Yami 满$49免运费
Yami 无忧退换
Yami 从美国发货

配送信息

  • 美国

    标准配送 $5.99(不包含阿拉斯加,夏威夷),最终价满$49免运费

    本地配送$5.99(加州,纽约州,新泽西,麻省和宾夕法尼亚,以上州部分地区);最终价满$49免运费

    两日达(包含阿拉斯加夏威夷)运费$19.99起

退换政策

亚米网希望为我们的客户提供最优秀的售后服务,让所有人都能放心在亚米购物。亚米自营商品在满足退换货条件的情况下,可在收到包裹的30天之内退换商品(食品因商品质量问题7天内可退换;为了确保每位客户都能获得安全和高质量的商品,对于美妆类产品,一经开封或使用即不提供退款或退货服务,质量问题除外;其他特殊商品需联系客服咨询)。
感谢您的理解和支持。

查看详情

由 亚米 销售

亚米电子礼品卡使用规则

若购买时选择自动充值,订单完成后礼卡将自动充值到您的账户中;

若购买时选择发送邮件,订单完成后系统将自动发送卡号和密码到您填写的邮箱;

发送邮件时,任何用户均可使用邮件中的卡号密码进行礼卡充值,请妥善保管邮件信息。

如接收邮件遇到问题,请联系客服处理;

发送邮件时,若礼卡没有被兑换,可以补发邮件。若已经被其他用户兑换,则无法补偿;

亚米网电子礼卡可用于购买自营或第三方商品;

亚米网电子礼卡没有有效期限制,长期有效;

亚米网电子礼卡的金额,可分多次使用;

亚米网电子礼卡业务规则,最终解释权归亚米网所有。

退换政策

已消费的电子礼卡不支持退款。

京东图书 销售

服务保障

Yami 满$49免运费
Yami 最优售后
Yami 美国本土发货

配送信息

  • 美国

    标准配送 $5.99(不包含阿拉斯加,夏威夷),最终价满$49免运费

    本地配送$5.99(加州,纽约州,新泽西,麻省和宾夕法尼亚,以上州部分地区);最终价满$49免运费

    两日达(包含阿拉斯加夏威夷)运费$19.99起

退换政策

提供30天内退还保障。产品需全新未使用原包装内,并附有购买凭据。产品质量问题、或错发漏发等,由商家造成的失误,将进行补发,或退款处理。其它原因需退货费用由客户自行承担。

由 京东图书 销售

服务保障

Yami 跨店满$69免运费
Yami 30天退换保障

亚米-中国集运仓

由亚米从中国精选并集合各大优秀店铺的商品至亚米中国整合中心,合并包裹后将一次合包跨国邮寄至您的地址。跨店铺包邮门槛低至$69。您将在多商家集合提供的广泛选品中选购商品,轻松享受跨店铺包邮后的低邮费。

退换政策

提供30天内退换保障。产品需在全新未使用的原包装内,并附有购买凭据。产品质量问题、错发、或漏发等由商家造成的失误,将进行退款处理。其它原因造成的退换货邮费客户将需要自行承担。由于所有商品均长途跋涉,偶有简易外包压磨等但不涉及内部质量问题者,不予退换。

配送信息

亚米中国集运 Consolidated Shipping 运费$9.99(订单满$69 包邮)

下单后2个工作日中国商家发货,所有包裹抵达亚米中国整合中心(除特别情况及中国境内个别法定节假日外)会合并包裹后通过UPS发往美国。UPS从中国发货后到美国境内的平均时间为10个工作日左右,根据直发单号可随时跟踪查询。受疫情影响,目前物流可能延迟5天左右。包裹需要客人签收。如未签收,客人须承担包裹丢失风险。

由 京东图书 销售

服务保障

满$69免运费
正品保证

配送信息

Yami Consolidated Shipping 运费$9.99(订单满$69包邮)


下单后1-2个工作日内发货。 物流时效预计7-15个工作日。 如遇清关,交货时间将延长3-7天。 最终收货日期以邮政公司信息为准。

积分规则

不参加任何折扣活动以及亚米会员积分制度。

退换政策

提供30天内退还保障。产品需全新未使用原包装内,并附有购买凭据。产品质量问题、或错发漏发等,由商家造成的失误,将进行补发,或退款处理。其它原因需退货费用由客户自行承担。

Yami

下载亚米应用

返回顶部

为你推荐

品牌故事

京东图书

为您推荐

Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折
Yami
欣葉
2种选择
欣叶 御大福 芋头麻薯 180g

周销量 600+

$1.66 $1.99 83折

评论{{'('+ commentList.posts_count + ')'}}

分享你的感受,帮助更多用户做出选择。

写评论
{{ totalRating }} 写评论
  • {{i}}星

    {{i}}星

    {{ parseInt(commentRatingList[i]) }}%

Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已购买 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}
Yami Yami
{{ comment.user_name }}

{{ showTranslate(comment) }}收起

{{ strLimit(comment,800) }}查看全部

Show Original

{{ comment.content }}

Yami
查看更多

{{ formatTime(comment.in_dtm) }} 已购买 {{groupData}}

{{ comment.likes_count }} {{ comment.likes_count }} {{ comment.reply_count }} {{comment.in_user==uid ? __('Delete') : __('Report')}}

暂无符合条件的评论

评论详情

Yami Yami

{{ showTranslate(commentDetails) }}收起

{{ strLimit(commentDetails,800) }}查看全部

Show Original

{{ commentDetails.content }}

Yami
查看更多

{{ formatTime(commentDetails.in_dtm) }} 已购买 {{groupData}}

{{ commentDetails.likes_count }} {{ commentDetails.likes_count }} {{ commentDetails.reply_count }} {{commentDetails.in_user==uid ? __('Delete') : __('Report')}}

请输入内容

回复{{'(' + replyList.length + ')'}}

Yami Yami

{{ showTranslate(reply) }}收起

{{ strLimit(reply,800) }}查看全部

Show Original

{{ reply.reply_content }}

{{ formatTime(reply.reply_in_dtm) }}

{{ reply.reply_likes_count }} {{ reply.reply_likes_count }} {{ reply.reply_reply_count }} {{reply.reply_in_user==uid ? __('Delete') : __('Report')}}

请输入内容

取消

End

发表评论
商品评分

请输入评论

  • 一个好的昵称,会让你的评论更受欢迎!
  • 修改了这里的昵称,个人资料中的昵称也将被修改。
感谢你的评论
你的好评可以帮助我们的社区发现更好的亚洲商品。

举报

取消

确认删除该评论吗?

取消

历史浏览

品牌故事

京东图书