相机系统允许实时面部识别

文章作者:Julien Happich

Vision-In-Package包含一个带有8MB RAM的ARM Cortex M4/M7摄像系统,一个动态范围成像仪,光学和通信接口。

通过培训机器学习算法,瑞士研究中心CSEM的研究人员设计了低功耗,实时脸部检测和识别相机系统,仅测量几立方厘米。

Vision-In-Package (VIP)系统包含了一个低功耗处理器(ARM Cortex M4/M7, 8MB RAM)、一个高动态范围成像器、光学和通信接口的摄像系统。该系统占地约4cm3,重量不到20g(包括一个电池),具有完整的面部分析管道,实时运行,并完全嵌入VIP系统。

该软件紧凑且独立,没有外部依赖。它由一个最小版本的uKOS操作系统和一个运行在上面的面部分析包组成。与运行在强大硬件架构上的现有系统不同,VIP系统需要的CPU时间和内存要少几个数量级,并且在QVGA分辨率下,分析流水线的运行速度约为每秒4-5帧。

首先,检测采集帧中的所有人脸,通常运行时间不到100毫秒,只需要几百KB内存。然后,在每个检测到的面部区域内,将眼角和鼻子等面部属性定位,然后人脸经过一个归一化步骤,这是一个大致的几何变换,将眼睛水平对齐,并将脸缩放到标准大小,连同一个光度归一化,消除了非线性强度变化造成的阴影和不均匀照明。

然后进行实际的人脸识别,在地标位置提取描述性特征,在注册人脸数据库中唯一地识别出人脸。新的个人可以在任何时间立即注册到这个数据库,只需一个简单的点击,而不需要任何再培训。

为了实现这一目标,研究人员使用了高效的机器学习算法,包括Adaboost、回归树集成和LBP算法,他们对数百万个带有ground truth注解的示例进行了训练。根据该团队的说法,生成的分类器通常需要几百字节的空间,并且即使在低端移动处理器上也能快速运行。

这个独立的部门可以用于可穿戴设备、营销和广告分析,以收集收视率和人口统计数据,用于更个性化互动的机器人,也可以用于电视制造商,汽车行业监测司机的睡意和分心情况,或用于自动设置调整。还有无处不在的监控摄像头。

首次由欧洲EENews出版。

留下你的评论