会员
Python网络爬虫与数据分析从入门到实践
马国俊更新时间:2024-12-28 12:00:59
最新章节:13.4 动手练习开会员,本书免费读 >
《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理、文本向量化技术,以及机器学习算法在数据分析中的应用。书中还给出了大量案例和项目,可以帮助读者快速上手,提高实用技能。《Python网络爬虫与数据分析从入门到实践》内容丰富,注重实操,适用于网络爬虫岗位、数据分析岗位的初级工程师和各类工程技术人员,还可作为高校经济、管理、人文社科、大数据等专业的教学用书。
品牌:清华大学
上架时间:2023-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
Python网络爬虫与数据分析从入门到实践最新章节
查看全部- 13.4 动手练习
- 13.3 以电子邮件的形式发送基于RSI指标的买卖点
- 13.2 以电子邮件的形式发送RSI指标图
- 13.1 实现发送电子邮件的功能
- 第13章 通过电子邮件发送数据分析结果
- 12.3 动手练习
- 12.2 数据预处理与数据分析
- 12.1 用Scrapy爬取二手房数据
- 第12章 二手房数据分析案例
- 11.3 动手练习
马国俊
主页
同类热门书
最新上架
- 会员
响应式编程实战:构建弹性、可伸缩、事件驱动的分布式系统
本书展示了如何利用事件驱动和响应式原理来构建健壮的分布式系统,减少延迟并提高吞吐量——特别是在微服务和无服务器应用程序中。本书分为四部分:第一部分介绍响应式的背景、环境和内容;第二部分深入讲解响应式,涵盖分布式系统的弊端、响应式系统和响应式编程;第三部分阐述如何使用Quarkus构建响应式应用程序,涵盖响应式引擎、响应式编程库SmallRyeMutiny、HTTP以及响应式数据访问的相关知识;第计算机11.1万字 - 会员
演进式架构(原书第2版)
本书提供了关于适应度函数、自动化架构治理和演进式数据的技术、知识和技巧。本书分为三个部分:第一部分包括定义演进式架构机制的章节——介绍团队如何使用技术和工具来构建适应度函数、部署管道以及其他管理和演进软件项目的机制;第二部分包括围绕耦合、复用和其他相关结构考虑因素的架构风格和设计原则,以帮助读者实现清晰的长期演进;第三部分探讨了第一部分中介绍的工程实践与第二部分中的结构考虑因素的交叉点。计算机12.8万字 - 会员
PHP从入门到精通(第7版)
《PHP从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用PHP进行网络开发需要掌握的各种技术。全书分为4篇共26章:基础知识篇包括初识PHP、PHP环境搭建和开发工具、PHP语言基础、流程控制语句、字符串操作、正则表达式、PHP数组、PHP与Web页面交互、PHP与JavaScript交互以及日期和时间;核心技术篇包括Cookie与Session、图形计算机16.4万字 - 会员
Python人工智能编程实践
本书在不涉及大量数学与编程知识的前提下,从零开始,逐步带领读者熟悉并掌握当下最新的基于Python3的人工智能编程工具,包括但不限于数据分析(Pandas),以及支持单机(Scikitlearn)、深度(PyTorch、TensorFlow、PaddlePaddle)和分布式(PySparkML)机器学习的开源程序库,等等。全书共分为4部分,分别如下。入门篇:包括对全书核心概念的指南性介绍,计算机9.4万字 - 会员
高效C/C++调试
《高效C/C++调试》是关于软件调试技术的深度探索,融合了作者的实践智慧。书中不仅指导读者如何使用专业的调试工具,还介绍了如何宏观和微观地分析问题,并**限度地发挥调试器功能。此外,书中还深入解读了调试背后的技术原理,如调试符号、内存管理及系统内核对内存的操作机制,以揭示内存管理的关键性和复杂性。除了介绍基础概念外,本书还涵盖了许多增强调试能力的工具与插件。尽管焦点集中在C/C++,但其中的策略与计算机16.3万字 - 会员
Java多线程并发体系实战(微课视频版)
《Java多线程并发体系实战(微课视频版)》全面、系统地介绍了与Java多线程相关的核心知识点,将官方多线程的核心知识点用链路的方式进行讲解。读者在学习的过程中需要循序渐进,核心知识点的理解是非常重要的,由核心知识点扩展开来就可以形成万物,希望读者在学习和创造的过程中能拥有自己的成长和思维。《Java多线程并发体系实战(微课视频版)》全书共10章。首章~第3章介绍了线程的核心知识点,第4章讲解了线计算机4.5万字 - 会员
Python网络爬虫与数据分析从入门到实践
《Python网络爬虫与数据分析从入门到实践》从初学者的视角出发,以案例实操为核心,系统地介绍网络爬虫的原理、工具使用与爬取技术,并详细讲解数据分析的各种技巧。本书主要内容包括:Python基础语法,数据分析工具NumPy、Pandas、Matplotlib的使用,网络爬虫库Urllib、BeautifulSoup、Scrapy,正则表达式在网络爬虫中的应用,数据预处理与数据分析方法、中文文本处理计算机9.2万字 - 会员
算法训练营:提高篇(全彩版)
本书图文并茂、通俗易懂,详细讲解常用的算法知识,又融入大量的竞赛实例和解题技巧,可帮助读者熟练应用各种算法解决实际问题。本书总计8章。第1章讲解STL,涉及双端队列、优先队列、位图、集合、映射和STL中的常用函数;第2章讲解实用的数据结构,涉及并查集、倍增、稀疏表、区间最值查询、最近公共祖先、树状数组和线段树;第3章讲解查找算法,涉及散列表、字符串模式匹配和字典树;第4章讲解平衡树,涉及树高与性能计算机10.7万字 - 会员
人人都能开发RPA机器人:UiPath从入门到实战
本书为UiPath的入门工具书。第1~3章介绍RPA与UiPath的基础知识;第4~5章依次介绍流程自动化基础知识与流程搭建的方法论,建议没有相关技术背景的读者详细阅读;第6~8章是UiPath流程开发的关键章,建议读者通读并跟练,便于加深记忆,熟练掌握相关知识,其中的关键知识可以根据章节索引,在实际开发时按需查阅;第9~10章介绍更深层次的云UiPathOrchestrator和机器人企业框架计算机11.2万字