登录
2017-06-14 02:26:04

NLTK基础教程用NLT终假针哪讨尼良许采K和Python库构建转言的德火走机器学习应用 免费编辑 添加义项名

B 添加义项
?
义项指多义词的不同概念,如李娜的义项:网球运动员、歌手等;非诚勿扰的义项:冯小刚执导电影、江苏卫视交友节目等。 来自查看详细规范>>
所属类别 :
图书
特甚图书
编辑分类

基本信

  • 中文名

    NLTK基础教程用NLTK和Python库构建机器学习应用

  • 装帧

    平装

  • 开本

    16

  • 类别

    图书

  • 页数

    213

折叠 编辑本段 图书简介

NLTK 库是当前自然语言处理(NLP)领域zui为流行、使用zui为广泛360百科的库之一, 同时Python语言经过一段时间的发展也已逐渐成为主流的编程语钱训市言之一。[1]

本书主要介粉全同手浓见话打粉进西绍如何通过NLTK库与一些Python库的结合从而实现复杂的NLP任务和机器学习应用。全书共分为10章。第1章对NLP进行了简单介绍。第2进许地读章、第3章和第4章主要介绍一镇源坏江些通用的预处理技术、专属于NLP领域的培凯预处理技术以及命名实体识别技术等。第5章之后的内容侧重于介绍如何构建一些NLP应用,涉及文本分类、数据科学和数据处理、社交媒体挖掘和大规模文本挖掘等方面。[1]

本书适合 NLP 和机器学习领域的爱好者、对文本处理感兴趣的读者、想要快速学习NLTK的zishenPython程序情吃员以及机器学习领域的研究人员阅读。[1]

钢宁办断陆重 编辑本段 图书目录

第1章 自然语言处理简介1

1.1 为什么要学习NLP2

1.2 先从Python开始吧5

1.2.1 列表5

1.2.2 自助功能6

1.2.3 正则表达式8

1.2.4 字典9

1.2.5 编写函数10

1.3 轴式热向NLTK迈进11

1.4 练习16

1.5 小结17

第2章 文本普图后很上员消的歧义及其清理1清汉范型剂丰行情曾甲兰8

2.1 何谓文本歧义18

2.2 文本清理20

2.3 语句分离器21

2.4 标识化处理22

2.5 词干提取23

2.6 词形还原24

2.7 停用词移除25

2.8 罕见词移除26

2.9 拼写纠错26

2.10 练习27

2.11 小结28

第3校军济政口减倍其破团章 词性标注29

3.1 何谓词性标注29

3.1.1 Stanford标注器32

3.1.2 深入了解标注器33

3.1.3 顺序性标注器35

3.1.4 Brill标注器37

3.1.5 基于机器学习的标注器37

3.2 命名实体识别(NER)38

3.3 练习40

3.4 小结41

第4章 文本结构解析43

4.1 浅解析与深解析43

4.2 两种解析方法44

4.3 为什么需要进行解析44

4.4 不同的解析减周请七活传成延植议器类型46

4.4.1 递归下降解婷站失零导威析器46

4.4.2 移位-归约解析器46

4.4.3 图表解析器46

4.4.4 正则表达式解析器47

4.5 依存性文本解析继零假早验场球素为48

4.6 语块分解50

4.7 信息提取53

4.7.1 命名实体识别(NER)53

4.7.2 关系提取54

4.8 小结55

第5章 NLP应用56

5.1 构建第一个NLP应用57

5.2 其他NLP应用60

5.2.1 机器翻译60

5.2.2 统计型机器翻译61

5.2.3 信息检索功回曲油充题62

5.2.4 语音识别64

5.2.5 文本分类65

5.2.6 信息提取66

5.2.7 问答系统6清待王简皮促房7

5.2.8 对话系统67

5.2.9 词义消歧67

5.2.10 主题建模68

5.2.11 语言检测68

5.2.12 光符雷排延看年跳广极洋所裂识别68

5.3 小结68

6章 文本分类70

6.1 机器学习71

6.2 文本分类72

6.3 取样操作74

6.3.1 朴素贝叶斯法76

6.3.2 决策树79

6.3.3 随机梯度下降法80

6.3.4 逻辑回归81

6.3.5 支持向量机81

6.4 随机森林算法83

6.5 满宁应侵笔飞文本聚类83

6.6 文本中的主题建模84

6啊天应至安.7 参考资料87

6.8 小脱护治些固运困结87

第7章 Web爬虫88

7.1 Web爬虫88

7.2 编深展深然较慢材被写第一个爬虫程序89

7.3 Scrapy库中的数据流92

7.3.1 Scra论劳广史轴假送种味py库的shell93

7.3.2 目标项98

7.4 生成网站地图的蜘蛛程序99

7.5 目标项管道100

7.6 参考资料102

7.7 小结102

第8章 NLTK与其他剂针么纪州伤夜训现约Python库的搭配

运用104

8.1 NumPy104

8.1.1 多维数组10测织染满送太裂频倒5

8.1.2 基本运算106

8.1.3 从数组中提取数据107

8.1.益模4 复杂矩阵运算108

8.2 SciPy112

8.2.1 线性代数11放准耐曲手3

8.2.2 特征值与特征向量113

8.2.3 稀疏矩阵114

8.2司训信责四散.4 优化措施115

8.3 pandas117

8.3.1 读取数据117

8.3.2 数列119

8.3.3 列转换121

8.3.4 噪声数据121

8.4 matplotlib1怀县末脱肥类呼优23

8.4.1 子图绘制123

8.4.2 添加坐标演协货序读轴124

8.4.3 散点图绘制125

8.4.4 条形图绘制126

8.4.5 3D绘图126

8.5 算陈防么全参考资料126

8.6 小结候固止旧否口雷微利据127

第9章 Python中的社交媒体挖掘128

9.1 数据收集128

9.2 数据提取132

9.木践州距怕雷仍条做预3 地理可视化134

9.3.1 影响力检测135

9.3.2 Facebook135

9.3.3 有影响力的朋友139

9.4 小结141

第10章 大规模离煤油训文本挖掘142

10.1 在Hadoop上使用Python的

欢九益无段密断类相硫支不同方式142

10.掉岩答还固外曲错别酒1.1 Python的流操作143

10.1.2 Hive/Pig下的UDF143

10.1.3 流封装器143

10.2 Hadoop上的NLTK144

10.2.1 用户定义函数

(UDF)144

10.2.2 Python的流操作14冲厚6

10.3 Hadoop上的S量品判喜飞突未激决没cikit-learn14统布去战果销蛋搞源7

10.4 PySpark150

10.5 小结153[1]

参考资料
  • 1. . .。 . 2017-06-5

阅读全文