会员
数据分析师养成宝典
程显毅 曲平 李牧更新时间:2019-09-23 15:14:53
最新章节:后记开会员,本书免费读 >
在数据为主导的今天,对于一种已经成型的模型,“怎么用”通常不是问题,用个软件或者编几行程序就能得到结果了,问题一般都出在模型“什么时候用”和“用完了,然后呢”。《数据分析师养成宝典》就集中讨论后面两件事情。《数据分析师养成宝典》共27章,分为业务理解篇(第1~4章)、指标设计篇(第5~7章)、数据建模篇(第8~16章)、价值展现篇(第17~19章)和实战进阶篇(第20~27章)。业务理解篇的目的是让读者建立正确的思维观,理解数据,熟悉业务;指标设计篇学习把数据转换为专家数据的一些技巧;数据建模篇以R语言为计算平台实施数据分析全过程;价值展现篇主要讨论如何撰写有价值的数据分析报告;实战进阶篇通过对8个经典案例的分析,使读者能够把学到的思维方法、实施工具应用到解决实际问题中,把数据变成价值。本书可供数据科学相关技术人员阅读,也可作为高等院校数据科学相关专业的教材或培训教材,以及数据分析爱好者的参考读物。
品牌:机械工业出版社
上架时间:2018-12-14 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
数据分析师养成宝典最新章节
查看全部- 后记
- 附录C 可视化数据挖掘Rattle包
- 附录B 大数据原理
- 附录A R语言中常用数据处理函数
- 附录
- 参考文献
- 第27章 窃电用户行为分析——决策树
- 第26章 航空公司顾客价值分析——聚类
- 第25章 如何获得更多的用户——多元回归分析
- 第24章 哪种广告的效果更好——假设检验
程显毅 曲平 李牧
主页
同类热门书
最新上架
Access 2016数据库教程(微课版·第2版)
全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等计算机13.8万字- 会员
数据库原理及应用实验:基于GaussDB的实现方法
本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训计算机6.9万字 - 会员
PySpark大数据分析与应用
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例计算机10.4万字 - 会员
轨迹数据分析方法及应用
随着信息、互联网、社交媒体、卫星定位、基于位置的服务(LocationBasedServices,LBS)等技术的发展,轨迹数据领域迎来了大数据时代。在轨迹大数据背景下,轨迹数据分析的关注度得到持续攀升,它能够借助移动对象的时空特征和移动行为信息发现新知识和模式,从而为智慧城市计算与服务、交通管理与规划、物流管理、智能制造、旅游路径推荐、自然灾害预测与预警、疫情传播监测等诸多领域提供决策支持与计算机9.6万字 - 会员
分布式数据库:原理与实践
本书全方位讲解分布式数据库的知识点,由易到难、由浅入深地带领读者在分布式数据领域不断深入。第1章主要介绍分布式数据库的起源与发展,并就分布式数据库的结构模式、作用及特点进行详细讲解。第2章主要对分布式技术、分布式服务架构、云数据库与容器化技术、大数据平台、分布式存储与数据库以及区块链技术进行详细介绍。第3章主要从分布式的基础理论、分布式事务分类以及分布式数据库分类、SequoiaDB数据库展开介绍计算机7.9万字 - 会员
剑指大数据:Flink实时数据仓库项目实战(电商版)
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了电商行业Flink实时数据仓库的搭建过程。在整个项目的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并穿插了大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、电商业务概述、数据仓库理论介绍和数据仓库建模等。最核心的内容是代码中对Flink的灵活应用,为读者展示了Flink处理数据的多种可能计算机13.1万字 - 会员
深入理解InfluxDB:时序数据库详解与实践
时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。计算机7.6万字 - 会员
分布式数据库基础与应用
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书计算机14万字 - 会员
企业级大数据项目实战:用户搜索行为分析系统从0到1
《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发计算机9万字