当前位置: 100md首页 > 电子书籍 > 资料下载2021 >
编号:47137
利用python进行数据分析.pdf
http://www.100md.com 2020年11月5日
第1页
第10页
第20页
第21页
第39页

    参见附件(139205KB,463页)。

    利用python进行数据分析

    《利用Python进行数据分析》适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。将IPython这个交互式Shell作为你的首要开发环境,讲述了从pandas库的数据分析工具开始利用高性能工具等内容,有需要的就快来吧

    图书简介

    从pandas库的数据分析工具开始利用高性能工具对数据进行加载、清理、转换、合并以及重塑;利用matpIotlib创建散点图以及静态或交互式的可视化结果;

    利用pandas的groupby功能对数据集进行切片、切块和汇总操作;处理各种各样的时间序列数据。

    《利用Python进行数据分析》适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。将IPython这个交互式Shell作为你的首要开发环境。

    作者简介

    WesMcKinney,资深数据分析专家,对各种Python库等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库――pandas,广获用户好评。

    相关内容预览

    编辑推荐

    还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。

    由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

    •将IPython这个交互式Shell作为你的首要开发环境。

    •学习NumPy(Numerical Python)的基础和高级知识。

    •从pandas库的数据分析工具开始。

    •利用高性能工具对数据进行加载、清理、转换、合并以及重塑。

    •利用matplotlib创建散点图以及静态或交互式的可视化结果。

    •利用pandas的groupby功能对数据集进行切片、切块和汇总操作。

    •处理各种各样的时间序列数据。

    •通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题

    图书目录

    目录

    前言 1

    第1章 准备工作 5

    本书主要内容 5

    为什么要使用Python进行数据分析 6

    重要的Python库 7

    安装和设置 10

    社区和研讨会 16

    使用本书 16

    致谢 18

    第2章 引言 20

    来自bit.ly的1usagov数据 21

    MovieLens 1M数据集 29

    1880—2010年间全美婴儿姓名 35

    小结及展望 47

    第3章 IPython:一种交互式计算和开发环境 48

    IPython基础 49

    内省 51

    使用命令历史 60

    与操作系统交互 63

    软件开发工具 66

    IPython HTML Notebook 75

    利用IPython提高代码开发效率的几点提示 77

    高级IPython功能 79

    致谢 81

    第4章 NumPy基础:数组和矢量计算 82

    NumPy的ndarray:一种多维数组对象 83

    通用函数:快速的元素级数组函数 98

    利用数组进行数据处理 100

    用于数组的文件输入输出 107

    线性代数 109

    随机数生成 111

    范例:随机漫步 112

    第5章 pandas入门 115

    pandas的数据结构介绍 116

    基本功能 126

    汇总和计算描述统计 142

    处理缺失数据 148

    层次化索引 153

    其他有关pandas的话题 158

    第6章 数据加载、存储与文件格式 162

    读写文本格式的数据 162

    二进制数据格式 179

    使用HTML和Web API 181

    使用数据库 182

    第7章 数据规整化:清理、转换、合并、重塑 186

    合并数据集 186

    重塑和轴向旋转 200

    数据转换 204

    字符串操作 217

    示例:USDA食品数据库 224

    第8章 绘图和可视化 231

    matplotlib API入门 231

    pandas中的绘图函数 244

    绘制地图:图形化显示海地地震危机数据 254

    Python图形化工具生态系统 260

    第9章 数据聚合与分组运算 263

    GroupBy技术 264

    数据聚合 271

    分组级运算和转换 276

    透视表和交叉表 288

    示例:2012联邦选举委员会数据库 291

    第10章 时间序列 302

    日期和时间数据类型及工具 303

    时间序列基础 307

    日期的范围、频率以及移动 311

    时区处理 317

    时期及其算术运算 322

    重采样及频率转换 327

    时间序列绘图 334

    移动窗口函数 337

    性能和内存使用方面的注意事项 342

    第11章 金融和经济数据应用 344

    数据规整化方面的话题 344

    分组变换和分析 355

    更多示例应用 361

    第12章 NumPy高级应用 368

    ndarray对象的内部机理 368

    高级数组操作 370

    广播 378

    ufunc高级应用 383

    结构化和记录式数组 386

    更多有关排序的话题 388

    NumPy的matrix类 393

    高级数组输入输出 395

    性能建议 397

    附录A Python语言精要 401

    利用python进行数据分析截图