您的当前位置:首页正文

一种基于高光谱成像技术的文检取证系统

2021-11-03 来源:榕意旅游网
第42卷第10A期 2015年10月 一计算机科学 Computer Science Vo1.42 No.10A Oct 2015 种基于高光谱成像技术的文检取证系统 尤俊生余成云吴江煌高志鹏 (厦门市美亚柏科信息安全研究所有限公司 厦门361008) 摘要高光谱技术在广大电磁波谱范围内实现了不同物质的分辨,早已在遥感领域大显身手,虽然国内亦有研究 机构提出了各种利用该技术进行司法鉴定的方法,但其往往结构复杂,成本极高,实现困难,实用价值较低。所提出 的高光谱文件取证技术在全面采用端元自动解混方法的同时,还提供了某些工作中需要的交互式提取方法,具备运 算简单、效率较高、针对性强以及取证效果明显等特点,同时保证了技术专业性,且在国内相同领域内属于最为完整 的工程系统,才具有价格低廉、操作简单等优势。 关键词 高光谱,光谱矢量特征,刑侦,取证,文检 中图法分类号TP3。9 文献标识码A Forensic Document Retrieval System Based on Hyperspectral Imaging Technology You Jun-sheng Yu Cheng—yun WU Jiang—huang GAO Zhi—peng (Xiamen Meiah Pico Information Security Institute Ltd.,Xiamen 361008,China) Abstract Hyperspectral technology in the majority of the electromagnetic spectrum range achieves a resolution of different substances,and it plays an active role in the field of remote sensing.Although the domestic research institu— tions also put forward a variety of methods using this technology for judicial appraisal,but thay often have complex structure,high cost,and is difficult to achieve low practical value.Hyperspectral text forensic technology uses the endmember automatic solution mixing technology,at the sme time it also provides an interactive extraction methods needed some work,with simple operation,hi【gh efficiency,targeted and the evidence effect being obvious and other features.While ensuring the technical expertise,they are the most complete engineering systems in the same field of our country,bringing inexpensive,easy to operate,and other advantages. Keywords Hyperspectral,Spectral feature vector,Criminal investigation,Forensic,Document retrieval 1 引言 高光谱成像技术可以获得一个像元多个光谱波 段的图像信息,因而蕴含着远比多光谱图像或二维 平面图像更多的细节内容,因此可以应用在比后两 者更为广阔的领域,也可以更好地反映出图像特征 的细微差距,目前已经在遥感、医疗、食品安全、化学 探索高光谱图像带来的各种可能性,也引进或研制 了一些可用于实战的设备。但是受研发力量有限、 研发成本较高、核心设备组件昂贵、设备操作较为专 业等客观条件限制,其应用深度和广度都未达到预 期的效果。就目前应用情况来看,文件资料检查是 高光谱成像技术在刑侦取证工作中应用最为密集的 环节,按照现有的行业成果,贺霖提出的高光谱目标 自动检测技术融合了子空间投影和多元随机变量二 成分检测等行业初露锋芒。基于其发展的高光谱图 像处理技术也迎来了欣欣向荣的局面。刑侦和取证 行业往往对图像的质量以及信息的丰富程度有较为 苛刻的要求,图像中任何细微的蛛丝马迹都可能成 为案件线索追踪的关键,就目前行业反馈的情况而 次型统计量高阶矩等主流光谱图像处理算法[1],在 地理遥感领域具有先进性;李振华提出的高光谱图 像处理平台从理论上阐述了其应用范围和大致应用 领域,并给出了简单的系统设计思路_2 ;郭雷等人提 言,单纯依靠人眼或二维平面图像远远无法满足此 类领域的需求,故全国公安、司法鉴定机构都在加快 出的高光谱图像融合最佳波段选择方法[3]在数据降 维、处理效率方面取得了成果。以上成果都针对光 尤俊生(1958一),男,硕士,工程师,主要研究方向为计算机取证、视频分析;高志鹏(1984一),男,学士,工程师,主要研究方向为计算机取证、 数据恢复、图像处理与机器学习,E-mail:gaozp@800188.crl。 ・ 87 ・ 谱成像技术中某些环节,有很强的理论性,在操作上 需要设定大量参数,无法帮助普通操作人员直接进 行文检工作,而我们提出的系统,则在整个高光谱处 理环节工程化方面达到了一定的高度,非常实用和 易于产业化,而且我们将皮尔逊检测法、交互式端元 处理法以及自动端元提取法结合使用,在保证易用 性的同时兼顾专业性,实现了纯软件控制和实时监 测,为复杂环境下的文检工作提供了保障。本文分 为5节,依次论述了:高光谱成像技术在刑侦取证领 域的发展背景;高光谱成像技术的硬件光学原理和 数据模型;该系统的硬件组成和指标;该系统所依赖 的图像像元解混算法;通过各种实验展示该系统在 文检取证工作中的效果。 2 文检类高光谱图像处理原理 光学成像是将某一区域反射或辐射的电磁波聚 焦在探测器单元,并获取影像上像元辐射量化值的 过程,其中空间分辨率和辐射分辨率为该类系统的 重要指标。空问分辨率是指从影响上能够识别的两 个物体的最小距离,辐射分辨率则由最小可分辨的 辐射差值决定。整个处理过程分为光学探测、空间 扫描、光谱分光的硬件处理部分,以及光谱数据文件 生成、光谱特征提取、光谱特征匹配与分类等软件处 理阶段。 2.1 文检类高光谱光学成像机理 光学系统在工作时,潜质物镜收集其视场角进 入系统的辐射能量,并汇集于物镜的焦平面上进行 映射成像,其具体包括物方采样和像方采样两个过 程。其中物方采样收集物方平面中扫描线上采样面 元的辐射能量,而像方采样由焦平面的光电探测器 附属电子系统进行,将焦平面映像转化为光电信号, 并形成对应的影像。接下来,通过反复地空间扫描, 我们可以获取每个像元的光谱信息。此外光谱分光 也是成像系统的重要组成部分,目前有棱镜/光栅色 散型分光技术和傅里叶变化型分光技术等。 对于文检工作来说,不同种类的材质在不同波 段的光波下可能有不同的反射、吸收、透射属性或者 受激发光特性,通过对物质在不同波段下的能量分 布成像,从而在图像上反映出他们的差别,为显现覆 盖字迹、印章字迹分离及复杂背景指纹提取等提供 了客观判别的物理基础,通过这种光谱图像差异鉴 别出原文件被破坏的情况。 本系统成像技术基于物质的反射特性进行成 像,在某个光波波段下,物质A和物质B所成的图 像能量密度分布S如下式所示: ・ 8R ・ S 一Ig(),)× (),)d7 J r S6一lg(),)×n(y)d7 J 因为不同物质的光谱信息可能互相重叠在同~ 像素点,所以需要将所得的不同波段的光谱图等相 关信息转换为本系统专有光谱格式,方便后期光谱 信息处理。 2.2成像数据模型 获得的影像数据应当是后期算法处理的关键, 根据数据模型的不同,后期的处理手段及算法选择 均不同。目前高光谱影像数据模型主要分为图像模 型、光谱模型和特征模型3种。图像模型以二维平 面空间存储数据,与普通数字图像无异,其信息贫 乏、图层极少、处理简单,只适用于快速直观的分析 任务。光谱模型以光谱曲线为主要分析对象,利用 目标的光谱响应与波长的变化关系来描述高光谱数 据内所蕴含的信息,可抽象为一条近似连续的曲线, 可进行匹配、分类等更高级的处理工作。特征模型 是指高光谱影像中每一个像元对应着多个波段的成 像反射值,可以用多维数据空间的N维向量表示, 其由于更适用于计算机离散环境下的数据处理工 作,因此是我们关注的重点。 3 文检类高光谱成像仪设计方案 高光谱成像系统由液晶调谐滤波器LCTF、光 学镜头、IDS科学级黑白CCD相机3部分组成,其 总体外观如图1所示。光学镜头和CCD相机组成 照相系统,LCTF作为分光元件置于镜头和CCD中 间构成了高光谱成像系统的主要硬件部分。这样将 LCTF的重量与相机直接相连,不会对机械结构产 生影响;同时,由于镜头和焦平面之间的光束口径通 常小于镜头的人瞳口径,因此对LCTF的口径要求 也可以稍微小一些。 图1高光谱成像系统 3.1 LCTF LCTF是基于偏振光的干涉原理和液晶电控双 折射效应,由若干利奥(Lyot)波片单元级联构成的 新型分光器件。其中单组利奥波片是由两个相互平 行的偏振片中间夹着液晶延迟片构成。当光源通过 其中一级单元时,由于沿着液晶快、慢轴传播的两束 光整栋方向相同,而相位差一定,因此发生干涉作 用。液晶因为是一种介于完全规则的液晶体和各向 同性液体之间的中间态物质,液晶分子的排列也不 像晶体分子排列那么牢固,所以很容易受到电场、磁 场、温度等外部刺激的影响,从而使光学性质发生变 化。当给液晶加上外部电压时,由于不同电场强度 的作用,液晶分子的长轴会发生不同角度的倾斜,双 折射率也会受到电场的影响发生变化。因此,可以 通过施加不同的电压使不同的光发生干涉,实现透 过波长的可选择性,真正起到调谐波长的作用。 高光谱成像系统中选用的LCTF工作光谱范围 为40O~750nm,半高宽为1O~25nm,通光孔径为 20mm,可通过电调谐获得所选范围内任意波长的半 高宽为10 ̄25nm的透过率曲线。LCTF通过外置 的控制器来进行控制,通过USB接口与计算机连 接,利用COM接口进行双向通信、传输控制指令和 状态请求。 3.2 CCD相机 选用了IDS科学级黑白CCD相机,该相机采用 Sony ICX445ALA CCD芯片,1/3英寸,1280×960 有效像素,在400 750nm范围内有较高的光谱响 应度,能够获取130万像素高分辨率多光谱图像,同 时具有在感兴趣区域开窗功能。该相机采用 USB2.0数据接口,可直接与计算机相连,可实现相 机供电及相机参数控制和高光谱图像数据的快速获 取、显示和保存。 3.3镜头 镜头具有USB2.0接口可以直接连接计算机, 具有自动变焦、对焦功能,实现电脑自动化控制。通 过调焦可以实现无穷远合焦,成像视场角为6O.2。x 3.7。。 4混合像元分解 尽管在整个高光谱应用学科体系中,像元解混 只是其中的一个重要环节,但是对文检取证工作来 说,解混是使敏感信息凸显的重要手段,故而也是整 个高光谱成像技术的文检取证系统中的算法核心。 4.1 混合像元分解技术原理 混合像元分解技术假设:在一个给定的场景里, 需要分析的对象可能由几种物质组成,并且这些物 质具有相对稳定的光谱特征,因此对象光谱的像元 反射率可以表示为端元的光谱特征和它们的面积比 例的函数。混合像元分解途径一般通过建立光谱的 混合模型实现。由于假设物质具有相对稳定的光谱 特征,场景中不同像元间光谱的差异主要是端元比 例变化的结果。 线性混合模型是应用最广泛的光谱混合模 型[4]。在线性模型中,混合光谱等于端元光谱与端 元面积比例的线性组合。该模型基于以下假设:到 达CCD相机的光子与唯一物质发生作用。线性模 型的数学表达式如下:r ̄--Xfix。+叫。为使LMM具 有物理意义,其需要受到两个约束条件限制:1)端元 面积比例之和为1;2)所有的端元比例都是非负的。 本系统采用线性混合模型进行物质解混合,有效地 分离了不同物质,达到了预期效果。具体解混合方 法可分两类:分类方法和去混合方法。 分类方法通过将合成后的伪彩色图像上光谱曲 线相近的像点重新赋值归为同类,从而达到区分不 同物质的目的,这种分析方法的优点是简单、方便、 分析结果直观、有说服力、对肉眼难以分辨的同种颜 色不同物质有较灵敏的区分效果。去混合的分析方 法根据各个像点平均亮度值分离重合的图像,获取 不同物质相对单一的影像,这一方法的优点是精确、 应用范围广,尤其是对因为显现不清晰、传统照相方 法记录有困难的指引等痕迹,物证有较好的加强效 果,能够使比较微弱的痕迹与背景反差得到最大限 度加强,为鉴定工作提供更多的信息。 4.2混合像元分解算法 目前,混合像元分解算法主要分为两种:一种是 有人为参与交互过程的交互式端元提取算法,另一 种是基于无监督机器学习的自动端元提取算法。 4.2.1端元个数的估计 进行混合像元分解的先决条件是较为准确地估 计出端元的个数,然而在现实中此类工作尤为困难, 只能尽可能地进行预估。 尼曼皮尔逊检测E5]算法是一种预估高光谱混合 影像中端元数目的算法,其实现原理是将端元个数 估计问题转换成一系列的假设检验问题,最后统计 非真假设条件成立的数量,也就是端元的数量。该 算法的实现步骤是:首先计算高光谱数据的自相关 矩阵RL× 和协方差矩阵K × 。然后分别计算两个 矩阵的特征值,并按照从大到小的顺序排列。我们 假设其中噪声为白噪声,均值为零,那么在信号源为 非随机未知正常数的条件下可以得出: A >B > , ===1,2,VD A >A > ,i=VD+1,L 其中, 为第i个波段的噪声方差,而端元数目VD 的求解可归结为L个如下所示的假设检验问题: H∞:A“一A 一0 H 1:Z ===A —A 一O, 一1…L ・ 89 ・ 

因篇幅问题不能全部显示,请点此查看更多更全内容