详情
内容介绍
本书主要介绍如何利用Kettle和Python这两个具有代表性的工具进行数据预处理的相关技术与方法,包括数据抽取、数据清洗、数据集成、数据变换等。全书有9章,内容涉及数据采集、环境部署、Kettle安装及应用、pandas应用,以及数据可视化的基础内容。本书采用任务式编写形式,将大数据预处理技术的理论和实现分解到一个个任务中,融入到一个个典型案例中,让读者在完成各任务的同时掌握和理解相关内容。 本书既有技术的深度,也有行业应用的广度,适合作为高等院校计算机、数据科学与大数据技术等相关专业课程的教材,也适合作为数据处理行业从业人员的参考用书。
相关信息
图书名称:数据采集及预处理基础与应用
ISBN:978-7-115-63525-9
作者:陈瑛 许桂秋 周敏
编辑:张晓芬
从书名:大数据技术与应用丛书
开本:16开
页数:240
印刷色数:单色
出版状态:已出版
出版日期:2024-02-02
作者简介:北京中科特瑞科技有限公司(“曙光瑞翼”)是大学云计算、大数据、人工智能等专业群实训方案综合供应商,我国领先的高等教育综合服务商。曙光瑞翼专注于校企合作,即深耕行业,对前沿技术的发展趋势、典型应用、市场前景、人才技能有着深刻的认识,又立足院校,对相关专业的人才培养目标、学生学习规律和特点、课堂难点重点有着贴切的感知,所设计的课程体系能够高度适配行业需要和院校的人才培养目标。作为国内知名的高等教育综合服务商,曙光瑞翼在校企联合培养上积累了丰富经验,凝练了7000余个教学视频、上万个课件资源、70余门专业课,合作院校数百所,每年培养专业人才数万人。
许桂秋,毕业于厦门大学,现为北京中科特瑞科技有限公司运营总监。主要研究方向为专注于大数据、人工智能技术领域的产教融合研究,承担机器学习、计算机视觉、人工智能导论、深度学习原理与TensorFlow实践、样本数据处理、自然语言处理等相关课程的授课任务。已出版专著《大数据导论》《Python编程基础与应用》《NoSQL数据库原理与应用》《数据挖掘与机器学习》等图书。
特别说明
大数据预处理案例式应用教程
本书卖点
1.本书是《大数据》编委会针对校企合作的精心力作。
2.本书凝结了曙光瑞翼多年的教学经验,能够满足校企融合教学的需求。
3.本书旨在介绍大数据预处理技术的基础知识,为即将学习大数据技术的读者奠定基础。
4.本书采用任务驱动的编写方式,读者可以直接进行实验效果体验,并进行自由调整。
5.本书采用大量的实践案例,结合行业典型应用,编写行业实践。
6.本书提供丰富的教学资源,包括电子课件、实验设计等。
相关图书
-
HCIA-WLAN学习指南
¥109.8
华为技术有限公司
-
HCIA-Datacom 网络技术学习指南
¥159.8
华为技术有限公司
-
HCIA-AI学习指南
¥129.8
华为技术有限公司
-
HCIA-5G学习指南
¥109.8
华为技术有限公司
-
数字化与数字经济
¥49.8
秦永彬
-
分布式数据库基础与应用
¥79.0
闭应洲 许桂秋 刘军
-
信息技术
¥64.8
张保华 朱宝生
-
数据可视化基础与应用
¥69.0
刘佳 许桂秋 李静雯
-
Linux操作系统管理与安全
¥69.8
许桂秋 仲柏同
-
Linux操作系统管理与运维
¥69.8
马婷 沈学建
-
2025秋季信通传媒精品教材书目
¥0.0
信通传媒
-
网络通信编程
¥69.8
刘金江
-
东数西算与数字经济
¥79.8
石勇、李彪、寇纲、郭琨
-
低空无人机集群反制技术
¥98.0
李学龙
-
寻求突破:中小企业数字化转型实践
¥79.9
董海峰
-
工业研发蝶变:数字化转型全攻略
¥99.8
田锋
-
中国摩托车年鉴2024版
¥129.0
中国摩托车商会 《摩托车》杂志