助力中文文字识别突破,美团公开首个真实场景招牌图像数据集

美团作为全球最大的本地生活服务平台,拥有由遍布全国的市场人员所拍摄的众多门脸招牌图片数据。每张图片都是由全国的不同个人,采用不同设备,在不同地点,不同时间和不同环境下所拍摄的不同目标,是难得的可以公正评价算法鲁棒性和识别效果的图片数据,挑战也非常大。近年来业界围绕着文字检测和文字识别提出了许多有效的算法和技术方案。由于之前公开的数据集普遍以英文为主,因此所提出的技术方案对中文特有问题关注不足。表...

美团技术团队 ·  1062阅读 ·  2021-05-12 09:53:19 
美团BERT的探索和实践

总第368篇2019年 第46篇背景2018年,自然语言处理(Natural Language Processing,NLP)领域最激动人心的进展莫过于预训练语言模型,包括基于RNN的ELMo[1]和ULMFiT[2]

美团技术团队 ·  1149阅读 ·  2021-05-12 09:46:09 
在RapidMiner中建立决策树模型

本教程的目的是介绍如何在RapidMiner中创建基本决策树。在本教程中,我将使用“ Iris”默认数据集。         1)访问此数据集,请单击“进程”选项卡,然后转到存储库并单击显示数据的存储库,然后打开下拉菜单以查看数据集“Iris”,如下图所示。         2)单击并将数据集拖到主流程窗口中。数据集的对象在窗口中应该出现一行线。将那条线连接到窗口角落的凹凸处,然后在屏幕顶部单击运

拓端小助手 ·  1093阅读 ·  2021-05-13 00:00:27 
深度学习-通用模型调试技巧

欢迎添加华为云小助手微信(微信号:HWCloud002 或 HWCloud003),输入关键字“加群”,加入华为云线上技术讨论群;输入关键字“最新活动”,获取华为云最新特惠促销。华为云诸多技术大咖、特惠活动等你来撩! 改善模型的步骤:1、根据人类表现估计贝叶斯最优错误率。贝叶斯最优错误率是理论上可能达到的最优错误率,也就是说没有办法设计出一个x到y的函数,让它能比这个最优错误率还低。比如一个猫狗识

华为云开发者社区 ·  785阅读 ·  2021-05-25 00:36:01 
深度学习在其他领域的应用1:密码破解

近年来,深度学习在人体感知方面(如视觉、听觉和理解)的应用有着显著的效果,许多人也跃跃欲试将其应用到传统领域,希望能给这些领域带来改变。老山也打算发表一个系列,历数深度学习在其他领域的应用。本系列不定期更新,不保证不太监,各个领域老山也只能管中窥豹,不全面、不准确之处还请大家谅解。话题本期的话题是深度学习能否用于密码破解呢?老山的答案是不能,或者是不实际。当然所有解答的前提是概念范畴的统一,为了说

华为云开发者社区 ·  708阅读 ·  2021-05-25 00:34:59 
利用深度学习识别滑动验证码缺口位置

做爬虫的同学肯定或多或少会为验证码苦恼过,在最初的时候,大部分验证码都是图形验证码。但是前几年「极验」验证码横空出世,行为验证码变得越来越流行,其中之一的形式便是滑块验证码。滑块验证码是怎样的呢?如图所示,验证码是一张矩形图,图片左侧会出现一个滑块,右侧会出现一个缺口,下侧会出现一个滑轨。左侧的滑块会随着滑轨的拖动而移动,如果能将左侧滑块正好滑动到右侧缺口处,就算完成了验证。由于这种验证码交互形式

华为云开发者社区 ·  754阅读 ·  2021-05-25 00:34:42 
DL Practice:Cifar 10分类

Step 1:数据加载和处理 一般使用深度学习框架会经过下面几个流程: 模型定义(包括损失函数的选择)——>数据处理和加载——>训练(可能包括训练过程可视化)——>测试 所以自己写代码的时候基本上按照这四大模块四步走就ok了。 本例步骤: A、Load and normalizing the CIF

infinite2021 ·  800阅读 ·  2021-05-24 17:20:40 
WSDM Cup 2019自然语言推理任务获奖解题思路

总第337篇2019年 第15篇美美导读:美团团队在刚刚结束的WSDM Cup 2019比赛“真假新闻甄别任务”中获得了第二名的好成绩。本文将详细介绍他们本次获奖的解决方...

美团技术团队 ·  1040阅读 ·  2021-05-12 09:55:21 
大众点评信息流基于文本生成的创意优化实践

1. 引言信息流是目前大众点评除搜索之外的第二大用户获取信息的入口,以优质内容来辅助用户消费决策并引导发现品质生活。整个大众点评信息流(下文简称点评信息流)围绕个性化推荐去连接用户和信息,把更好的内容推荐给需要的用户。信息流推荐系统涉及内容挖掘、召回、精排、重排、创意等多层机制和排序。本文主要围绕创意部分的工作展开,并选取其中重要的文本创意优化做介绍,分为三个部分:第一部分阐述几个重点问题,包括...

美团技术团队 ·  1029阅读 ·  2021-05-12 09:52:02 
配送交付时间轻量级预估实践

总第361篇2019年 第39篇在本文中,我们介绍了交付时间预估迭代的三个版本,分别为基于地址结构的树模型、向量召回方案以及轻量级的End-to-End的深度学习网络。同...

美团技术团队 ·  1119阅读 ·  2021-05-12 09:46:51 
【Kaggle】鸟叫识别

目录赛题识别声景录音中的鸟叫声文件数据下载地址赛题理解code音频数据转图像切分训练集和验证集训练测试赛题识别声景录音中的鸟叫声 您在本次比赛中面临的挑战是确定哪些鸟类在长录音中调用,因为培训数据是在有意义的不同环境中生成的。这正是科学家试图自动化对鸟类种群的远程监测所面临的确切问题。本次比赛以上一场比赛为基础,增加了来自新地点的声景、更多的鸟类物种、关于测试集录音的更丰富的元数据以及火车集的声景。文件介绍trai...

wx60962e30e0986 ·  1037阅读 ·  2021-05-08 16:05:31 
【AI in 美团】深度学习在美团搜索广告排序的应用实践

总第251篇2018年 第43篇AI(人工智能)技术已经广泛应用于美团的众多业务,从美团App到大众点评App,从外卖到打车出行,从旅游到婚庆亲子,美团数百名最优秀的算法...

美团技术团队 ·  1029阅读 ·  2021-05-12 09:27:43 
20210528 TensorFlow 的基本用法

1-1#tensorflow1.0之后的版本实现[tf1对应python3.5版本,尝试可用]#tf1版本的好处,网上有大量的资料;tf1在一些公司的使用还是比较多的;tf1是目前深度学习框架最难的#基于以上3点,所以推荐tf1版本#warnings用来屏蔽警告,因为tf1会出现很多警告,这些警告和代码运行时无关的importwarningswarnings.filterwarnings("ign

ATaburiss ·  576阅读 ·  2021-05-28 11:41:00 
学习索引结构的一些案例——Jeff Dean在SystemML会议上发布的论文(中)

【摘要】 为了克服挑战并探索模型作为索引替代或丰富的潜力,我们开发了学习索引框架 (LIF),递归模型索引(RMI)和基于标准误差的搜索策略。 我们主要关注简单的全连接神经网络,因为它们的简单性,但其他许多类型模型也是可能的。摘要: 原文: https://www.arxiv-vanity.com/papers/1712.01208/ 视频:https://www.youtube.com/wa...

华为云开发者社区 ·  576阅读 ·  2021-05-25 09:54:27 
多方安全计算:隐私保护集合求交技术

PSI全称隐私保护集合交集(Private Set Intersection, PSI),是指持有数据的两方能够计算得到双方数据集合的交集部分,而不暴露交集以外的任何数据集合信息。

华为云开发者社区 ·  630阅读 ·  2021-05-21 11:53:43 
20210520 规则分词的实现

1-1获取词典和最大长度#规则分词#函数的输入就是词典的路径defread_word_dict(dic_path):"""加载词典,获取词典最长词的长度:paramdic_path:词典的路径:returndictionary,maxlength:返回词典和词典的最大长度"""#词典以集合的形式进行存储,用集合的目的是去重dictionary=set()maxlength=0#词典中最长词的长度#

ATaburiss ·  639阅读 ·  2021-05-21 10:23:46 
DS-5调试CYCLONE V(1)---hello world

1、从下图可以看到裸程序可以由preloader加载,所以要调试裸程序要做的第一件事是生成并编译一个preloader。生成preloader的过程,很多资料可以查到。首先要使用qsys生成的配置文件,该配置文件放在quartus工程的hps_isw_handoff\som_hps_hps_som目录。2、生成与编译一个preloader1)、打开soc eds 16.1

benjorsun ·  654阅读 ·  2021-05-26 21:24:34 
RNN,LSTM与GRU

1.语言模型语言模型用于对特定序列的一系列词汇的出现概率进行计算。一个长度为m的词汇序列{w1,…,wm}的联合概率被表示为P(w1,…,wm)。由于在得到具体的词汇之前我们会先知道词汇的数量,词汇wi的属性变化会根据其在输入文档中的位置而定,而联合概率P(w1,…,wm)的计算通常只考虑包含n个前缀词的词窗口而非考虑全部的前缀词: P(w1,…,wm)=∏i=1i=mP(wi

wx5d786476cd8b2 ·  1032阅读 ·  2021-05-07 17:56:32 
About the Mean Shift

Mean Shift算法,一般是指一个迭代的过程。即先算出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点,继续移动,直到满足一定的条件结束。 meanshift可以被用来做目标跟踪和图像分割。 参考《Mean Shift:A Robust Approach Toward Feature

infinite2021 ·  766阅读 ·  2021-05-24 17:12:21 
AI技术在智能海报设计中的应用

背景在视觉设计领域中,设计师们往往会因为一些简单需求付出相当多的时间,比如修改文案内容,设计简单的海报版式,针对不同机型、展位的多尺寸拓展等。这些工作需要耗费大量的时间、人力成本(5~6张/人日),但对设计师的进步成长起到的作用却非常有限。另一方面,精准营销是未来的大趋势,在大流量背景下,首页的海报资源展位需要展示“千人千面”的效果,这对海报的生产效率也提出了非常高的要求。所以,我们美团外卖技术团

美团技术团队 ·  1006阅读 ·  2021-05-12 09:31:22 
推荐博主
东方佑
353上传 14204阅读
wx6084d152d85c2
193上传 7643阅读
tingf
192上传 49329阅读
华为云开发者社区
190上传 12784阅读
wx5b1fd43180419
138上传 4935阅读
Copyright©2005-2021 51CTO.COM 版权所有 未经许可 请勿转载