十大针对机器学习的文本注释工具与服务,你会选用哪个?

编译作者: 陈峻 2020-10-23 09:39:08

【51CTO.com快译】目前,从搜索引擎与情感分析,到虚拟助手与聊天机器人,机器学习应用场景中的许多研究领域,都需要通过文本注释工具与服务来提供准确性。在AI研究与开发行业中,发现或创建可注释的数据对于项目团队而言,是一项昂贵而艰巨的任务。因此,人们经常把那些持有大量高质量已注释数据的团队,戏称为“家里有矿”。不过幸运的是,业界有着许多可用于文本注释的工具和服务,能够帮助我们获取所需的数据,进而实现包括实体提取、词性标注、以及情感分析在内的各种操作。

下面,我将和您一起探讨目前十大针对机器学习的文本注释工具与服务。您可以根据自己项目的实际情况,从中做出选择并试用。

1. Tagtog

Tagtog是一款由波兰软件公司开发的工具,可用于自动化或手动注释文本。Tagtog既支持原生的PDF注释,又包含了可用于自动化文本注释的预训练NER(Named Entity Recognition,命名实体识别)模型。除了Tagtog工具,该公司还拥有来自各个领域的专家网络,能够为文本注释提供专业的服务。

2. LightTag

LightTag工具能够方便企业和项目成员在内部平台上,标记其文本数据。在套餐设计方面,尽管该工具的入门包是免费的,但是不同级别的工具包,有着不同的售价,以及每个月可提供注释的数量限制。其中,免费版的数量是每月1000个注释。

3. Lionbridge AI

专门从事语言学研究的Lionbridge,不但拥有百万用户规模的社区,而且能够支持三百多种语言。通常,它能够提供的文本注释服务包括:文本提取、情感分类、实体注释、命名实体识别、以及语言成分分析等。此外,Lionbridge还提供了一种可以自定义数据注释软件,以方便用户团队将其授权并应用到各种文本注释的项目中。

4.Scale

总部位于旧金山的Scale,是计算机视觉和NLP(Natural Language Processing,自然语言处理)数据注释服务的提供商。通过将人工干预与Scale平台相结合,该公司提供了诸如OCR转录、文本分类与比较等文本注释类型的服务。

5. KConnect

许多AI研究人员和开发团队往往会碰到的一个问题是:如何才能访问到那些隶属于高度专业化领域的AI训练数据。KConnect团队就致力于帮助注释者用户快速、有效地对医疗领域的数据进行分类和注释。具体而言,KConnect为医疗类信息提供了语义注释、文本分析、以及语义搜索等服务。

6. Clickworker

总部位于美国和德国Clickworker,是一家众包公司。它拥有庞大的从业团队,能够执行各项任务。他们在文本注释领域所提供的服务包括:情感分析与分类。

7. ParallelDots Text Annotation API

ParallelDots能够提供文本注释类工具和多种API。他们的解决方案包括:情感分析、情绪分析、关键字提取器、以及命名实体识别等。

8. Appen

作为一种以众多形式实现AI训练数据的服务,Appen拥有来自各个国家的大量贡献者。它所提供的文本注释服务涵括了:情感注释、意图注释、以及命名实体注释等方面。

9. Dandelion API

源自意大利的Dandelion API提供了丰富的自动化文本注释工具。尽管它是该领域相对较新的创业公司,但是其工具可被用于实体提取、情感分析、以及文本与内容分类等不同场景中。

10. Dataturks Text Annotation Tools

借助着数据注释内部API、以及上千家合作外包公司,Dataturks能够提供各种图像和文本注释的工具。具体而言,它的文本标记功能包括:文本分类、命名实体识别、以及词性标记等。

借助上述各种先进的文本注释工具,相信您的团队能够构建出属于自己的自定义工作流程和数据注释平台,并能够满足特定应用场景的项目需求。

原文标题:10 Best Text Annotation Tools and Services for Machine Learning,作者: Limarc Ambalina

【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】

机器学习 人工智能 AI
上一篇:缺失何在?当下机器学习教育的短板 下一篇:未来工业人工智能将如何为炼油行业提供动力
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

用新的机器学习思考方式 来辨别自然异常与人为误导

某些对抗性事件很可能是人为设计而来。我们必须知晓其中的手法与工件是什么,这样才能真正理解深度神经网络的可靠性。

佚名 ·  23h前
1.8M超轻量目标检测模型NanoDet,比YOLO跑得快

目标检测一直是计算机视觉领域的一大难题,其目标是找出图像中的所有感兴趣区域,并确定这些区域的位置和类别。目标检测中的深度学习方法已经发展了很多年,并出现了不同类型的检测方法。

佚名 ·  1天前
5G助力下,未来10年将是人工智能的“黄金十年”

近日,习近平总书记在G20峰会第一阶段会议上指出,疫情激发了5G、人工智能、智慧城市等新技术、新业态、新平台蓬勃兴起,“非接触经济”全面提速,为经济发展提供了新路径。

科技日报 ·  1天前
新时代如何把握住人工智能的优势,让自己不被时代淘汰

随着人工智能在企业的应用和发展,企业领导者必须着眼于基于云计算的人工智能和现代化的数据结构,以提高市场竞争力。

尚学堂java学院 ·  1天前
对话李兰娟:人工智能将疫情“一网打尽”,让医疗更精准

李兰娟指出,人工智能、大数据在这次抗疫中发挥了作用,首先是发现和控制传染源方面,通过大数据人工智能我们能够了解到与传染源接触到的所有人;第二是人员流动的控制,包括健康码、红外线测温等等,极大程度地了解了人的健康情况。

新京报 ·  1天前
面向未来系统设计的机器学习

Elias Fallon是行业领先的电子设计自动化技术提供商Cadence Design Systems公司的工程主管。他带领其定制IC研发团队以及电子设计自动化(EDA)产品团队进行项目开发。

Elias Fallon ·  1天前
人工智能如何在大数据处理中应用

人工智能,是处理大数据最理想和最有效的方法。我们的世界一直沉浸在大数据中,你能想到的任何话题,无论在线还是离线,都有大量的数据,如我们的日常活动、对无生命事物的偏好、属性、用途等等。下面,我们就来看看人工智能是如何在大数据处理中应用的?

W ·  1天前
在智能家居设备中融合ML和IOT

人工智能是一项正在常规基础上进行大量研究的技术。

Cassie ·  1天前
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载