Machine Learning for Text

590

本书介绍

文本分析是一个信息检索、机器学习和自然语言处理界面的领域,本教科书仔细地涵盖了从这些交叉主题中抽取的连贯的组织框架。本教科书的章节分为三类:

基本算法:第一章至第七章讨论了文本机器学习的经典算法,如预处理、相似度计算、主题建模、矩阵分解、聚类、分类、回归和集成分析。

域敏感挖掘:第8章和第9章讨论了结合多媒体和网络等不同领域的文本学习方法,并结合排序和机器学习方法,讨论了信息检索和网络搜索的问题。

以序列为中心的挖掘:第10至14章讨论了各种以序列为中心的语言和自然语言的应用,如特征工程、神经语言模型、深度学习、文本摘要、信息提取、意见挖掘、文本分割和事件检测。

本教材详细介绍了机器学习主题由于内容广泛,根据课程水平,可以从同一本书提供多个课程。尽管演讲以文本为中心,但第3章至第7章涵盖了机器学习算法,这些算法通常在文本数据之外的域内使用。因此,这本书不仅可以用于文本分析,也可以从更广泛的机器学习角度(以文本为背景)提供课程。

本教材以计算机科学研究生以及从事这些相关领域的研究人员、教授和工业从业人员为对象。本教材附有课堂教学解决方案手册。

目录

Chapter 1 Machine Learning For Text: An Introduction

Chapter 2 Text Preparation And Similarity Computation

Chapter 3 Matrix Factorization And Topic Modeling

Chapter 4 Text Clustering

Chapter 5 Text Classification: Basic Models

Chapter 6 Linear Classification And Regression For Text

Chapter 7 Classifier Performance And Evaluation

Chapter 8 Joint Text Mining With Heterogeneous Data

Chapter 9 Information Retrieval And Search Engines

Chapter 10 Text Sequence Modeling And Deep Learning

Chapter 11 Text Summarization

Chapter 12 Information Extraction

Chapter 13 Opinion Mining And Sentiment Analysis

Chapter 14 Text Segmentation And Event Detection

下载地址:Machine Learning for Tex.zip

更多免费电子书,请关注我的简书主页