一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新:涵盖140种语言组合

作者: 鱼羊 2020-05-19 10:33:31

 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

现在,你可以用 GitHub 上最火的 NLP 项目做机器翻译了。

没错,就是 Hugging Face (抱抱脸)标星 26.9k 的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1008 种模型,正式涉足机器翻译领域。

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

模型涵盖 140 种不同语言组合,中文翻英文,英文译法语,法语翻阿拉伯语……还能一对多翻译。

就像这样:

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

抱抱脸创始人 Clement Delangue 表示:

全世界有那么多人在使用我们的开源项目,越来越多使用不同语言的人聚集在NLP社区。

这让我们意识到,应该在模型中提供更多其他语言的接入,同时也提供翻译。

1008种机器翻译模型

据抱抱脸介绍,这1000+模型,是研究人员使用无监督学习和 OPUS 数据集训练的。

OPUS 项目来自赫尔辛基大学及其全球合作伙伴,旨在收集和开源各种语言数据集,尤其是低资源(小语种)语言数据集。

部分模型

并且,抱抱脸也在 Transformer 项目中增加了喜闻乐见的 Seq2Seq 模型。

比如谷歌 AI 的 T5,Facebook 的 BART

使用方法,一如既往的简单。

比如用 opus-mt-en-ROMANCE 这个模型同时进行英语翻法语、英语翻葡萄牙语和英语翻西班牙语,一个 API 就搞定了。

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

就有网友评价道:节约时间的利器。

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

关于 Hugging Face Transformer

抱抱脸的 Transformer Python 库目前已有超过 50 万 pip 安装量,SQuAD排行榜上的最佳语言模型们通通被收编其中。

比如谷歌 AI 的 BERT、XLNet,Facebook AI 的 RoBERTa,OpenAI 的 GPT-2。

使用简单,只需一个 import。

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

支持 TensorFlow 2.0 和 PyTorch 之间的深度互操作。

还有在线 Demo 供你实时调戏。

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

这样的万星项目,NLPer 用了都说好。

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新

这就用起来?

传送门

GitHub 项目:https://github.com/huggingface/transformers

机器翻译 GitHub NLP
上一篇:人工智能正在改变软件开发的模式 下一篇:远程医疗市场预测2020年增长近65%
评论
取消
暂无评论,快去成为第一个评论的人吧

更多资讯推荐

GitHub近10万星:印度小哥用Python和Java实现所有AI算法

今天两个算法实现的项目又登上了GitHub热榜,每逢招聘季必上榜?此前,这两个项目曾多次登顶,分别用Python和Java实现了面试中常考的算法,AI行业就业形势日趋严峻,而算法岗更是竞争激烈,是时候复习一下基本功了!

佚名 ·  2020-05-19 14:27:10
脑机接口新发现!睡着后,大脑会回放清醒时的经历

此前科学家仅在啮齿动物等非人类动物身上观察到过这一过程,而在一项脑-机接口的试点临床试验中,美国麻省总医院、哈佛医学院、布朗大学、加州大学圣地亚哥分校等院所的一组科研人员首次在 2 名人类参与者的大脑运动皮层中观察到了习得神经激发序列的重放过程。

付静 ·  2020-05-08 10:12:25
脑机接口技术重大突破!首次帮助瘫痪男子恢复动作和触觉

据外媒报道,触觉是我们感受外部世界不可或缺的感官,但许多人却因脊髓损伤或因患病瘫痪而失去这种能力。不过,最近非营利组织巴特尔研究所的研究人员宣称,他们首次利用脑机接口(BCI)技术帮助一名美国瘫痪男子恢复了手部触觉。

·  2020-04-29 15:45:42
《Nature》子刊:不仅是语言,机器翻译还能把脑波「翻译」成文字

如果将人脑的神经信号也视为一种语言,那么将机器翻译架构应用于解读神经信号的可行性似乎并不令人惊讶。在《Nature Neuroscience》的一篇论文中,来自加州大学旧金山分校的研究者实践了这一想法。

机器之心 ·  2020-04-27 10:37:53
自然语言处理的应用前景

自然语言处理(NLP)是人工智能技术的一个分支,它使计算机能够像人们一样理解、处理和生成语言,并且在商业中的应用正在迅速增长。

Terena Bell ·  2020-04-24 10:53:08
未来已来 脑机接口新突破 人脑信号转文本准确率达97%

据国外媒体报道,一个由加州大学旧金山分校的研究团队打造的新型人工智能系统可根据人脑信号来生成文本,准确率最高可达97%。亚马逊和谷歌等科技公司打造的虚拟助手相当先进,语音识别能力比起几年前进步惊人,近年来人们才刚开始领会它们的威力。

乐邦 ·  2020-04-23 13:17:53
脑机接口利器,从脑波到文本,只需要一个机器翻译模型

加州大学旧金山分校的Joseph Makin 等人在 Nature Neuroscience上发表了一篇论文,标题为《利用 encoder-decoder 框架,将大脑皮质活动翻译为文本》(Machine translation of cortical activity to text with an encoder–decoder framework)。

蒋宝尚 ·  2020-04-01 11:12:43
Google 开源最新 NLP 模型,能处理整本《罪与罚》

Transformer 可谓是近年 NLP 领域关注度颇高的模型之一。近日,Google 又推出了 Transformer 的“升级版”——Reformer。

Rachel ·  2020-01-18 14:50:13
Copyright©2005-2020 51CTO.COM 版权所有 未经许可 请勿转载