资源名称:命令行中的数据科学 完整版pdf

第1章 简介  1
1.1 概述  1
1.2 数据科学就是OSEMN  2
1.2.1 数据获取  2
1.2.2 数据清洗  2
1.2.3 数据探索  3
1.2.4 数据建模  3
1.2.5 数据解释  3
1.3 插入的几章  4
1.4 什么是命令行  4
1.5 为什么用命令行做数据科学工作  6
1.5.1 命令行的灵活性  6
1.5.2 命令行可增强  6
1.5.3 命令行可扩展  7
1.5.4 命令行可扩充  7
1.5.5 命令行无处不在  7
1.6 一个现实用例  8
1.7 延伸阅读  11
第2章 入门指南  13
2.1 概述  13
2.2 设置数据科学工具箱  13
2.2.1 步骤1:下载和安装VirtualBox  14
2.2.2 步骤2:下载和安装Vagrant  14
2.2.3 步骤3:下载并启动数据科学工具箱  14
2.2.4 步骤4:登录(Linux 和Mac OS X)  16
2.2.5 步骤4:登录(微软Windows)  16
2.2.6 步骤5:关闭或重启  16
2.3 必要的概念和工具  17
2.3.1 环境  17
2.3.2 运行命令行工具  18
2.3.3 五类命令行工具  19
2.3.4 命令行工具的组合  21
2.3.5 输入和输出重定向  22
2.3.6 处理文件  23
2.3.7 寻求帮助  24
2.4 延伸阅读  26
第3章 数据获取  27
3.1 概述  27
3.2 将本地文件复制到数据科学工具箱  28
3.2.1 本地数据科学工具箱  28
3.2.2 远程数据科学工具箱  28
3.3 解压缩文件  29
3.4 微软Excel电子表格的转换  30
3.5 查询关系数据库  32
3.6 从互联网下载  33
3.7 调用Web API  35
3.8 延伸阅读  36
第4章 创建可重用的命令行工具  37
4.1 概述  38
4.2 将单行转变为shell脚本  38
4.2.1 步骤1:复制和粘贴  39
4.2.2 步骤2:添加执行权限  40
4.2.3 步骤3:定义shebang  41
4.2.4 步骤4:删除固定的输入  42
4.2.5 步骤5:参数化  42
4.2.6 步骤6:扩展PATH  43
4.3 用Python 和R 创建命令行工具  44
4.3.1 移植shell 脚本  45
4.3.2 处理来自标准输入的流数据  46
4.4 延伸阅读  47
第5章 数据清洗  49
5.1 概述  50
5.2 纯文本的常见清洗操作  50
5.2.1 行过滤  50
5.2.2 值提取  54
5.2.3 值替换和删除  55
5.3 处理CSV  56
5.3.1 主体、头部和列  56
5.3.2 对CSV执行SQL查询  60
5.4 处理HTML/XML 和JSON  61
5.5 CSV的常见清洗操作  65
5.5.1 列的提取和重排序  65
5.5.2 行过滤  66
5.5.3 列合并  67
5.5.4 多个CSV文件的合并  70
5.6 延伸阅读  73

…….


资源截图:

image.png

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长QQ&VX:1754646538 提供付款信息为您处理。

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源。