老钱《自然语言处理》实战训练营-文本相量化项目实践(附源码)

课程目标:自然语言处理进阶-文本向量化方法

24小时内答疑 课时永久观看 15分钟内无条件退款
1. 仅限付费视频课程适用
2. 购买后15分钟内可以找到客服进行沟通退款
3. 退款将返还至51CTO学院账户,不支持提现
4. 下载资料后不再享有退款特权
5. 客服(Tel:400-101-1651)
6. 最终解释权归51CTO所有
共9课时,共1小时4分钟
现价¥109.00
购买
  1. 课程介绍
  2. 课程大纲
课程目标

自然语言处理进阶-文本向量化方法

适用人群

具备自然语言处理导论基础;了解自然语言处理的基本概念;熟悉Python

课程简介

《老钱------AI实战训练营的系列课程》= 多个案例掌握《文本向量化》

       

     文本情感分析一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速掌握文本向量化项目。全面覆盖经典的场景,如地名提取,病例命名实体提取,覆盖多种算法,如LDA,LSA,Word2Vec,TFIDF, PLSA等


  课程特色   

          1.案例驱动:专题技术,完整案例;

          2.源码操作:内含完整程序源码和数据集;

          3.实战指引:覆盖《文本向量化》四大过程模型;

          4.系统学习:一套完整的《文本向量化》建设方法论,迅速掌握文本向量化的开发过程。

          

     适合人群


         1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。

         2.具备Python基础,熟悉机器学习的基础理论

         3.具备自然语言处理的基础知识


  课程大纲:

      

文本相似度

1. 文本特征提取原理概述

1.1.     什么是特征提取:。

1.2.     为什么要进行特征提取: 

1.3.     常见的特征提取思路及对比:布尔模型(0/1 ,,存在就是1,不存在就是0,举例。)、空间向量模型(通过一定的规则或者方法将文本映射到向量空间上,常见的有两种:1-基于布尔型,2-基于词频的)、主题模型(tf-idf,lsa,lda)、深度学习模型(word2vec、cnn)。

1.4.     特征提取方法之-布尔模型

1.5.     特征提取方法之-空间向量模型

1.6.     特征提取方法之-主题模型

1.7.     特征提取方法之-主题模型之tf-idf

1.7.1      tf-idf原理

1.7.2      tf-idf环境准备:

1.7.3      tf-idf代码实现

1.7.4      论文

1.8.     特征提取方法之-布尔模型之LSA

1.8.1 LSA原理详解

1.8.2 LSA环境搭建

python3.x 

gensim

jieba (conda install -c conda-forge jieba)

1.8.3 LSA代码实现

1.8.4 参考论文

1.9. 特征提取方法之-布尔模型之LDA

1.9.1 LDA原理

1.9.2 LDA环境搭建

1.9.3 LDA代码实现

1.9.4 参考论文

1.10.  特征提取方法之-深度学习模型原理

1.11.  特征提取方法之-深度学习模型-word2vec

word2vec是google在2013年推出的一个NLP工具。它可以将所有的词向量化。

1.11.1 word2vec原理

1.11.2 word2vec环境搭建

1.11.3 word2vec代码实现

1.11.4 参考论文


第一章文本向量化概述
2节6分钟
1-1文本特征提取的目的与意义 [免费试看]
02:02
1-2文本特征的提取的常用方法
04:57
第二章文本向量化算法实践
7节57分钟
2-1TFIDF优缺点
04:23
2-2LSA算法实践
07:58
2-3PLSA
03:55
2-4LDA算法原理
06:00
2-5LDA算法实践
08:16
2-6TF-IDF实践
14:06
2-7文本特征提取的常用方法-Word2Vec实践
13:10
讲师介绍
Jack Qian
讲师评分3.3分
楚门智能创始人,昆士兰理工大学数据科学硕士,前阿里高级研发工程师,Cloudera认证讲师,Cloudera认证大数据管理员;多年大数据行业经验,原联想电商大数据平台负责人,主要科研方向为数据科学,在自然语言处理领域有资深的经验,参与过多个百亿级别得大数据项目,操作过真正得大数据集群。并拥有咨询、大数据产品设计、商务等多方面得资深经验。擅长Spark、Hadoop等平台架构,讲课风格幽默风趣、实战为主。
X
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载