老钱《自然语言处理》实战训练营-文本聚类项目实践(附源码)

课程目标:掌握文本聚类原理;文本聚类方法;理解文本聚类实现guo'c

24小时内答疑 课时永久观看 15分钟内无条件退款
1. 仅限付费视频课程适用
2. 购买后15分钟内可以找到客服进行沟通退款
3. 退款将返还至51CTO学院账户,不支持提现
4. 下载资料后不再享有退款特权
5. 客服(Tel:400-101-1651)
6. 最终解释权归51CTO所有
共25课时,共1小时29分钟
现价¥109.00
购买
  1. 课程介绍
  2. 课程大纲
课程目标

掌握文本聚类原理;文本聚类方法;理解文本聚类实现guo'c

适用人群

具备自然语言处理的基础;例如分词;熟悉Python;熟悉基本的深度学习框架Keras

课程简介

  《老钱------AI实战训练营的系列课程》= 多个案例掌握《文本聚类》

       文本聚类一直是NLP领域的热门应用,常用在舆情分析,文章分类,智能客服等多个场景。本课程以案例驱动出发。结合多个项目实战案例,协助学习者迅速掌握文本聚类的项目实现流程,实现方法,实现过程全面覆盖经典的场景,如豆瓣图书相似度分析,微博新话题发现,覆盖多种算法,包括短文本聚类,长文本聚类,同时掌握自己设计聚类算法。


     课程特色   

          1.案例驱动:专题技术,完整案例;

          2.源码操作:内含完整程序源码和数据集;

          3.实战指引:覆盖文本聚类四大过程模型;

          4.系统学习:一套完整的文本聚类建设方法论,迅速掌握文本分类的开发过程。包括SignlePaas,KMeans,文本相似度方法等


   课程部分课件展示:

     

image.png



image.png



image.png

image.png


     适合人群


         1. 想要从事NLP的在校学生、NLP研发工程师、NLP产品经理,想要转型NLP的IT老兵。

         2.具备Python基础,熟悉机器学习的基础理论

         3.具备自然语言处理的基础知识



     具体课程大纲如下:


            

                1.文本聚类分析概述  

                  1.文本聚类定义与典型应用场景

                    1.文本聚类定义

                    2.文本聚类的应用场景

                  2.文本聚类分析的难点

                  3.文本聚类分析的意义

                  4.文本聚类分析技术实现的一般流程

                  5.文本聚类任务使用的技术有哪些

                    1.基于聚类算法的聚类

                    2.基于文本相似性的聚类

                    3.基于规则的方法

                  6.文本聚类项目的评价方法

                

                

                2.长文本聚类实践-聚类算法方法-豆瓣电影TOP250榜单内的电影剧情聚类

                  1.电影剧情聚类项目背景介绍

                  2.电影剧情聚类项目设计

                  3.聚类算法用于文本聚类的过程

                  3.剧情数据处理

                  4.剧情分词

                  5.特征提取与向量化

                  6.基于KMeans完成电影剧情聚类

                  7.基于DBScan完成电影剧情聚类

                  8.效果对比

                  9.项目总结

                

                3.短文本聚类实践-新浪微博话题发现

                  1.新浪微博话题发现项目背景介绍

                  2.新浪微博话题发现项目设计

                  3.短文本聚类的难点

                  3.微博数据处理

                  4.微博分词

                  5.微博特征提取与向量化

                  6.基于KMeans完成聚类

                  7.效果分析

                  8.项目总结

                

第一章快速带您了解文本聚类概念与实现过程
5节11分钟
1-1文本聚类定义与典型的应用场景 [免费试看]
02:25
1-2文本聚类难点
03:14
1-3文本聚类的一般流程
01:07
1-4文本聚类使用的技术
02:06
1-5文本聚类项目的评价方法
02:14
第二章<长文本聚类>项目实践-豆瓣图书相似度分析
9节29分钟
2-1项目背景介绍
02:02
2-2数据集介绍
01:45
2-3项目架构设计
01:08
2-4项目初始化与数据加载开发
02:38
2-5定义分词与加载停用词的方法
04:54
2-6实习TF-IDF完成文本聚类
02:23
2-7聚类开发
04:41
2-8结果的可视化
09:32
2-9项目总结
00:40
第三章<短文本聚类>项目实践-新浪微博新话题发现
11节48分钟
3-1项目背景介绍
01:37
3-2数据与运行效果
02:36
3-3项目架构设计
01:46
3-4微博数据加载
11:30
3-5切词与停词库加载
05:00
3-6自己实现TFIDF求文章词向量
07:13
讲师介绍
Jack Qian
讲师评分3.3分
楚门智能创始人,昆士兰理工大学数据科学硕士,前阿里高级研发工程师,Cloudera认证讲师,Cloudera认证大数据管理员;多年大数据行业经验,原联想电商大数据平台负责人,主要科研方向为数据科学,在自然语言处理领域有资深的经验,参与过多个百亿级别得大数据项目,操作过真正得大数据集群。并拥有咨询、大数据产品设计、商务等多方面得资深经验。擅长Spark、Hadoop等平台架构,讲课风格幽默风趣、实战为主。
X
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载