近日,谷歌通过官方博客,介绍了图像识别领域取得的一些重大进展。这个识别技术最早是在ImageNet计算机视觉挑战比赛(ILSVRC)上展示。ImageNet视觉识别挑战每年举办一次,旨在发现更好的图像技术,尤其是物体识别和锁定这两方面。目前主要的参赛者来自于学术机构和实验室。
在今年的比赛里面,隶属于Google的GoogLeNet团队刷新了“分类和侦测”记录,其精度比去年的记录提升了两倍。目前他们已经把这个项目公开,希望能够邀请更多人来参与其中,借此来加速项目的发展。
这个挑战遵循三个步骤:分类、分类并锁定以及侦测。分类主要是测试所选用的算法是否可以正确的给图片中的物体贴上相应的标签。分类并锁定主要是测试算法在图像识别和锁定潜在物体上的能力。侦测和第二个步骤比较类似,但是这个环节会使用更加苛刻的评估标准,所使用的图像包含了很多非常细小的物体。在侦测环节中,性能优越的图像识别技术是可以在复杂场景中精准锁定和识别物体的。
Google的物体识别图像技术涉及到神经网络技术和深度学习技术。该系统在无需庞大计算资源支撑的背景下,能够对识别物体的标准进行优化和微调,并最终识别出物体。从谷歌发布的照片中我们可以看出,目前这项技术可以识别出我们常见的物体,比如宠物猫、鸡蛋、香蕉、橘子、电视机、显示器、书架等。
这个技术目前还处于早期研发阶段,随着这个技术的进步与成熟,我们将可以用上更好的图像识别技术。这个技术也可以直接对接到Google旗下的一些产品和服务,例如图片搜索、YouTube、自动驾驶技术以及有必要使用图像识别技术的领域。