我们日常的网络活动中,有不少都是在进行搜寻,而文字搜寻之外,非文字搜寻例如声音或者图像搜寻变得越来越普及。这些功能需要人工智能辅助以分析声音或者图像内容,微软的搜寻用人工智能算法 SPTAG 最近终于开源化,让开发社群可以参与和使用这技术。微软的 Space Partition Tree And Graph(SPTAG)人工智能算法可以使开发人员能够以毫秒为单位筛选向量,也就是单词、图像像素和其他数据点的数学表示形式。微软表示,SPTAG(用 C++ 编写并用 Python 包装)是众多 Bing 搜寻服务的核心,已应用协助公司的研究人员更深入理解数十亿个网络搜寻「背后的目标」,并提供更准确的结果。

微软表示,Bing Search 至今已对超过 1,500 亿条数据进行了编目,包括单个单词、字符、网页代码和完整查询。Bing 团队期望开源 SPTAG 可用于建立可辨识基于声音片段所说语言的应用方式,或类似拍摄花卉照片时可以辨识品种的功能。Bing 计划经理 Rangan Majumder 表示,探索深度矢量搜寻真正潜力的研究也只是个开始,认为这个技术未来可以有更多应用。