文
章
目
录
章
目
录
Apache Spark作为分布式计算领域的核心框架,在大规模数据处理中应用广泛。《Spark 深度学习指南》结合Spark的分布式特性,系统讲解深度学习技术的落地实践,为大数据与人工智能领域的学习者提供了实用指南。感兴趣的读者可下载该书籍的电子版,深入探索Spark与深度学习的融合应用。
书籍基本信息
本书由美国数据科学家Ahmed Sherif与机器学习专家Amrith Ravindra共同撰写,黄友良担任译者,2020年1月由电子工业出版社出版,博文视点出品。全书共372页,定价109元,ISBN为9787121378829。书中聚焦Spark框架下的深度学习技术,通过案例驱动的方式,帮助读者掌握从环境搭建到模型开发的全流程技术。
内容简介
全书以“理论讲解+实战案例”为核心,围绕Spark与深度学习的整合展开:
- 基础技术栈搭建:详细介绍Spark开发环境的配置流程,涵盖Ubuntu系统安装、Spark集群部署、Jupyter Notebook集成等操作,帮助读者快速构建开发环境。
- 核心模型实践:深入卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)等经典模型,结合MNIST图像识别、股票价格预测等场景,演示模型训练与优化过程。
- 应用场景拓展:覆盖自然语言处理(TF-IDF文本分析)、计算机视觉(人脸识别、图像分类)、推荐系统(Keras电影推荐引擎)等多个领域,提供从数据预处理到模型部署的完整解决方案。
本书兼顾技术深度与实践广度,适合高等院校相关专业学生、大数据初学者及技术从业者阅读。
作者简介
- Ahmed Sherif:拥有西北大学预测分析硕士学位,深耕数据科学领域多年,现任职于微软公司,负责云端机器学习与深度学习解决方案开发。著有《实用商业智能》,擅长将复杂技术转化为工程实践。
- Amrith Ravindra:具备电气与工业工程背景,专注于机器学习算法研究,通过数据科学社区与Ahmed Sherif合作著书,致力于推动机器学习技术的普及与应用。
本书审稿人Michal Malohlava为Sparkling Water项目创始人,Adnan Masood博士为微软数据平台专家,进一步保障了内容的专业性与权威性。
章节目录
全书分为13章,结构清晰,侧重实战:
- 开发环境搭建:涵盖多平台系统安装、Spark集群配置及Jupyter集成,解决环境部署难题。
- 神经网络基础:从数据帧操作到激活函数实现,逐步构建基础神经网络模型。
3-4章:针对CNN与RNN的核心难点(如图像预处理、梯度消失问题)展开技术解析。
5-13章:通过消防呼叫预测、文本生成、房价预测等10余个实战案例,覆盖不同领域的深度学习应用,每个案例包含数据下载、特征工程、模型训练及性能评估全流程。
《Spark 深度学习指南》以分布式计算框架为基石,构建了深度学习技术的工程化实践体系。如需系统学习Spark与深度学习的结合应用,欢迎下载该书籍的电子版,解锁更多技术细节与实战经验。