驱动中国2017年10月25日消息 近期,未来让自家AI学会机器视觉识别,谷歌推出了人类行为动作数据库AVA,这个视频数据库包括了海量Youtube的海量影视视频。谷歌想让AI对视频片段中人物的行为动作进行学习记录,分析,从而准确识别视频中的人类行为。
谷歌发布的AVA数据库, 所包含的影视视频来自于不同国家的不同类型的影片,这是为了锻炼AI对不同的语言种类、人物面孔进行更为精准的识别技能,谷歌还将开放这个数据库,最终目的就是要提高培养AI系统的社交视觉智能。
其实,谷歌费尽心机就是想让AI系统获得计算机视觉识别能力,这种识别来自于图形图像识别、模糊视觉信息识别,并将从静态图像领域发展到动态视频领域。AVA就是基于原子视觉行为,进行人类行为识别系统开发,并对基于时空间隔标签的复杂行为进行建模。
谷歌软件工程师大卫罗斯表示,“教会机器识别影像中人物的行为是发展计算机视觉的一大基本难题。”可以看出谷歌在通过基于计算机识别技术的机器视觉识别,令AI系统变得更加智能。其实,同谷歌的策略布局非常吻合,国内知名计算机视觉技术厂商超多维及其子公司ivvi科技在AI、AR、图形图像识别、模糊视觉信息识别领域同样有深度的布局。
ivvi科技及其母公司超多维在计算机视觉领域有多年的技术积累,超多维从2004年开始深耕计算机视觉领域,在全球范围内拥有1000余项专利,专利授权率高达91%。依托超多维,ivvi科技在今年4月份推出了首款智能3D手机ivvi K5,其视觉运动芯片的创新在业内是首创,视觉体验效果证明柱状光栅显示技术在业内也处于领先地位。
今年以来,ivvi科技极具前瞻性的提出了“智能3D”发展策略,并完成了对AI 、VR/AR、裸眼3D、视觉信息模糊计算等技术的生态布局。未来,ivvi科技将打造涵盖教育、购物、医疗等垂直应用领域的智能3D平台体验。
评论 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交