海量视频搜索与视频侦查系统
随处可见的视频监控,无非就是摄像头不停地抓拍录像。然而,一旦须要检索视频中的特定目标,人们面对的往往是在成千上万个小时的海量视频中大海捞针,传统上须要投入的人力和时间,简直让人不敢想象,也很不现实。因此,如何通过计算机程序快速从海量视频中搜索特定目标,已经成为当前视频检索和视频侦查迫切须要解决的问题。
当前市场存在的视频侦查系统,普遍仅仅是依赖于传统局限的“帧差法”、“背景建模法”、“颜色分类法”等,从视频中检测所有运动目标,开发出的系统大多停留在“视频摘要”、“视频浓缩”、“拌线检测”、“人车分类”等非常初期、浅显的检索阶段,并没有进行特定目标的搜索,在海量视频检索任务中,人工筛选工作量仍然非常巨大,甚至无法接受。此类视频检索系统,尽管有关公司宣传如何地增强案件侦查能力,实际应用效果却非常有限,经受不住实际案件的检验。
因此,近年来,越来越多的开发者将重点投入到“以图搜图”这一热点主题的研究上,希望能够取得明显进展成果。然而,因技术方面主要存在很大的困难和挑战,如同类别差异、视点变化、光照差异、遮挡问题、复杂背景等,指望单纯通过“以图搜图”计算的“图像相似度”搜索海量视频中的特定目标,研究进展举步维艰,实际应用效果也非常局限,满足不了复杂多变的海量视频侦查任务。
作者完全自主研发的“梯度视频搜索系统”,继承并突破传统图像处理技术,允许用户根据实际情况,自定义视频侦查任务,创新性地提出并构建“级联检测器检测+验证器校验”的多级多个神经网络组成的神经计算专家系统,实现海量视频“多目标多场景”的同时搜索。
不同于单纯的“以图搜图”,“梯度视频搜索系统”根据侦查任务的N(N≥1)个已知场景或M(M≥1)张已知图像,提取、处理和扩充已知视频或已知图像中的特征图像序列,将其作为样本集合训练搜索系统内核(多级多个神经网络组成的神经计算专家系统),实现海量视频“多目标多场景”的同时搜索,并且根据案件侦查的深入推进,支持已知场景的增加、删除和修改等。
“梯度视频搜索系统”首先根据已知的嫌疑人视频场景片段(已知场景可通过“梯度视频浓缩系统”检索等其它辅助方法得到),自动提取关键特征图像序列,并经一序列预处理和后处理,将关键特征图像序列扩充成不同光照、不同角度、不同变形等多种情况,形成更多的特征图像序列,将其作为样本集合,模拟人类大脑思维训练人工神经网络,最后使用经过训练的搜索系统内核,对海量视频执行搜索任务。
电脑型号 华硕 All Series 台式电脑
操作系统 Windows 7 旗舰版 64位 SP1 ( DirectX 11 )
处 理 器 英特尔 Core i7-4770 @ 3.40GHz 四核
主 板 华硕 Z97-C (英特尔 Haswell)
内 存 16 GB ( 金士顿 DDR3 1600MHz )
主 硬 盘 西数 WDC WD10EZEX-08M2NA0 ( 1 TB / 7200 转/分 )
显 卡 Nvidia GeForce GTX 750 ( 1 GB / 七彩虹 )
显 示 器 三星 SAM0915 S22B310 ( 21.7 英寸 )
光 驱 东芝-三星 CDDVDW SH-224DB DVD刻录机
声 卡 瑞昱 ALC892 高保真音频
网 卡 英特尔 Ethernet Connection (2) I218-V / 华硕
截至2014年08月31日,“梯度视频搜索系统”已先后经过3个案件的实测:2013年04月06日江夏杀妻抛尸案、2013年08月07日武昌小区盗窃案、2014年04月11日武汉大学强奸案。
该案共有73GB约292小时的监控视频,视频格式全部为.mp4,画面质量模糊。
实测中,采用一台普通i7台式计算机,运行2个进程,搜索时间分别为:4.1小时、4.5小时,平均搜索时间为4.3小时。
在这73GB约292小时的监控视频中,通过传统人工方法检索受害人和嫌疑人,共找到6处。“梯度视频搜索系统”的搜索结果为:搜到6处,遗漏0处。
图5.1 2013年04月06日江夏杀妻抛尸案搜索结果(6处)
搜索结果如图5.1,第1张为受害人2013年04月05日00:49:49出来捡垃圾的截图,第2张为嫌疑人2013年04月05日00:53:01穿着短裤出来看他妻子捡垃圾的截图,第3张为受害人2013年04月05日02:52:26捡完垃圾回家的截图,第4张为嫌疑人2013年04月06日16:08:01从外面回家的截图,第5张为嫌疑人2013年04月06日19:49:30提着他妻子尸体出来的截图,第6张为嫌疑人2013年04月06日19:52:25骑电动车抛尸的截图。
该案共有90GB约117小时的监控视频,视频格式全部为.mp4,画面质量高清。
实测中,采用一台普通i7台式计算机,运行2个进程,搜索时间分别为:5.4小时、6.2小时,平均搜索时间为5.8小时。
在这90GB约117小时的监控视频中,通过传统人工方法检索嫌疑人,共找到21处。“梯度视频搜索系统”的搜索结果为:搜到24处(其中,人工已找到的有19处,人工未找到的有5处),遗漏2处。
图5.2 2013年08月07日武昌小区盗窃案搜索结果(24处)
搜索结果如图5.2(其中带有红色边框的为传统人工检索未找到的5处截图),第1张为嫌疑人作案前在第2路摄像头第1次出现的截图,第2张为嫌疑人作案前在第2路摄像头第2次出现的截图,第3张为嫌疑人作案后在第2路摄像头第3次出现的截图,第4张为嫌疑人作案前在第3路摄像头出现的截图,第5张为嫌疑人作案前在第5路摄像头第1次出现的截图,第6张为嫌疑人作案前在第5路摄像头第2次出现的截图,第7张为嫌疑人作案前在第6路摄像头第1次出现的截图,第8张为嫌疑人作案前在第6路摄像头第2次出现的截图,第9张为嫌疑人作案前在第7路摄像头第1次出现的截图,第10张为嫌疑人作案前在第7路摄像头第2次出现的截图,第11张为嫌疑人作案后在第7路摄像头第3次出现的截图,第12张为嫌疑人作案前在第8路摄像头第1次出现的截图,第13张为嫌疑人作案后在第8路摄像头第2次出现的截图,第14张为嫌疑人作案前在第9路摄像头第2次出现的截图,第15张为嫌疑人作案前在第10路摄像头第1次出现的截图,第16张为嫌疑人作案前在第10路摄像头第2次出现的截图,第17张为嫌疑人作案前在第10路摄像头第3次出现的截图,第18张为嫌疑人作案后在第10路摄像头第4次出现的截图,第19张为嫌疑人作案前在第11路摄像头第1次出现的截图,第20张为嫌疑人作案前在第11路摄像头第2次出现的截图,第21张为嫌疑人作案前在第12路摄像头第1次出现的截图,第22张为嫌疑人作案前在第13路摄像头出现的截图,第23张为嫌疑人作案前在第15路摄像头第1次出现的截图,第24张为嫌疑人作案前在第15路摄像头第2次出现的截图。
遗漏2处分别为:嫌疑人作案前在第9路摄像头第1次出现(图5.2.1)、嫌疑人作案前在第12路摄像头第2次出现(图5.2.2)。
图5.2.1 嫌疑人作案前在第9路摄像头第1次出现
图5.2.2 嫌疑人作案前在第12路摄像头第2次出现
该案共有221GB的监控视频,包含.264、.mp4、.csv5、.dat等多种视频格式,画面质量既有高清,也有模糊。
实测中,采用两台普通i7台式计算机,每台运行2个进程,共4个进程,因硬件配置差异和视频分配不均,搜索时间分别为:7.6小时、8.9小时、11.3小时、16.9小时,平均搜索时间为11.2小时。
在这221GB的监控视频中,通过传统人工方法检索嫌疑人,共找到4处。“梯度视频搜索系统”的搜索结果为:搜到3处,遗漏1处,搜到另外2处疑似。
图5.3.0为已知场景(1处),图5.3.1至5.3.3为搜到结果(3处),图5.3.4为遗漏结果(1处),图5.3.5至5.3.6为疑似结果(2处)。
图5.3.0 已知场景(1处)
图5.3.1 搜到结果(3处)- 第1处
图5.3.2 搜到结果(3处)- 第2处
图5.3.3 搜到结果(3处)- 第3处
图5.3.4 遗漏结果(1处)
图5.3.5 疑似结果(2处)- 第1处
图5.3.6 疑似结果(2处)- 第2处
搜索遗漏的主要原因在于拍摄条件和已知场景的差异较大,这可以通过“二次搜索”解决,即:将第一次搜到的其它场景也作为已知场景,再次执行搜索任务,便可搜到遗漏的嫌疑人目标。
“梯度视频搜索系统”支持“多目标多场景”的同时搜索,可根据案件侦查的深入推进,增加、删除和修改已知场景,执行“N次搜索”,确保搜索到的嫌疑人目标及其时空轨迹的完整性。
案件实测表明,“梯度视频搜索系统”值得推广应用,通过计算机程序快速从海量视频中搜索特定目标,大大提高案件侦查效率。
今后,“梯度视频搜索系统”将在“增大检测率的同时减小误判率”上加以改进和升级,进一步提升软件系统的搜索性能。