支持向量数据描述在烟叶异物检测中的应用

发布时间:2019-08-24 来源: 幽默笑话 点击:


  摘 要:针对烟叶异物检测中很难全面收集异物样本数据的问题,提出一种基于支持向量数据描述方法(SVDD)的烟叶异物检测方法。该方法只需要烟叶样本数据,就可建立单值分类器。首先,提取烟叶与几种典型异物的RGB分量与HSV分量;然后,选取烟叶的HV分量作为特征向量,训练SVDD分类器,实现烟叶异物的分类识别;最后,通过接受者操作特性(ROC)曲线对比了SVDD与其他3种方法的分类效果。实验结果表明,采用HV分量降低了数据维数,提高了计算效率;SVDD方法具有很好的分类效果和计算效率,能很好地区分烟叶与异物。
  关键词:支持向量数据描述;异物检测;烟叶样本;HV分量;分类识别
  中图分类号: TP274.3文献标志码:A
  ?
  Application of support vector data description to detection of foreign bodies in tobacco
  ?
  HUANG Shi?jian??1,2?*?
  ?(
  1.School of Physics and Electron Engineering, Yangtze Normal University, Chongqing 408100, China?;??
  2.Key Laboratory of Optoelectronic Technology and Systems ?(?Chongqing University?),? Ministry of Education, Chongqing 400044, China
  )?
  Abstract:
  It is difficult to fully collect foreign body sample in detecting foreign bodies from tobacco. A detection method based on Support Vector Data Description (SVDD) was proposed. Thus a one?class classifier can be developed by using tobacco samples soly. RGB and HSV of tobacco and several typical foreign bodies were firstly extracted; then the HV component was used as eigenvector. A developed SVDD classifier was applied to distinguish foreign bodies from tobacco by inputting the HV eigenvector. Finally through the Receiver Operating Characteristic (ROC) curve, the SVDD classifier was compared with three other methods in classification effect. The experimental results show that by adopting feature extraction with HV component, the data dimension was reduced and a higher computation efficiency was achieved. The SVDD classifier has a stronger classification ability and higher efficiency, which could distinguish foreign bodies from tobacco better.
  ?Key words:
  Support Vector Data Description (SVDD); foreign body detection; tobacco sample; HV component; classification
  ?
  
  0 引言?
  国内大多数烟草生产线上都采用金属探测仪检测和剔除金属异物,并辅之以人工剔除其他异物的方法??[1-2]?,这些方法的异物剔除率受人为因素影响较大。因此研究烟叶异物自动检测系统极为重要,自动检测的关键技术多采用机器视觉技术与模式识别技术相结合??[3]?,其中分类方法的选择是否恰当,直接影响最后的检测结果。但近年来国内外针对烟叶异物的分类技术却鲜有报道,而常用的可以借鉴的分类方法有贝叶斯分类算法、支持向量机等传统方法和支持向量数据描述??[4-6]?(Support Vector Data Description, SVDD)等单值分类算法。但贝叶斯分类等传统分类方法在对训练样本不平衡领域如烟叶异物检测中异物种类繁杂甚至无法预知的情况时表现得力不从心,本文提出将支持向量数据描述方法运用到烟叶异物检测技术中,该方法已在很多训练样本不平衡的领域(如机械故障诊断??[7-8]?、语音识别??[9]?、图像识别等领域)得到了成功应用??[10-12]?。运用该方法只需用烟叶的HV分量数据训练单值分类器,就可实现分类,可以解决难以提取异物训练样本的问题。?
  
  1 颜色空间?
  RGB颜色空间的基本原理是采用红(R)、绿(G)、蓝(B)3个颜色分量来表示所有的颜色。HSV颜色空间模型是孟塞尔色彩空间的简化形式,直接采用彩色特性意义的3个分量:色度(H)、饱和度(S)、亮度(V)来描述颜色,更符合人对颜色的描述习惯。?
  RGB颜色空间有不均匀和不直观的缺点,HSV颜色空间的三分量相对独立,易通过设定不同权值将其融合在一起,具有计算量小等优点。?
  2 支持向量数据描述算法简述?
  SVDD的基本思想是把要描述的对象作为一个整体。假定一个目标集(Target)?包含有n个需要描述的目标对象{x?i|x?i∈R?d;i=1,2,…,n},构成单值分类器的n个学习样本。试图找到一个体积最小的超球体,使全部(或尽可能多) 的x?i都包含在该超球体内,而非目标样本?(Outliers)?就位于超球体外, 为了增强分类的鲁棒性,引入松弛变量ξ?i。最小化超球体的体积是一个二次规划问题,即应满足:?
  
  3 实验研究?
  从人主观观察的角度看,烟叶异物在颜色、形状、大小、轻重、材质等方面都存在差异。但从机器视觉系统的角度来看,被检测物的轻重材质等特征难以获取,而形状、大小等参数又不具备明显的规律性,这使得颜色成了烟叶异物检测中最为重要的特征参量。?
  在烟叶异物检测中最重要的是识别出烟叶与非烟叶(即异物),如再进一步识别出异物的具体类型费时费力且没有必要,因此考虑用单值分类方法对烟叶异物进行分类识别,把烟叶识为目标样本,将所有的异物都识为非目标样本。用烟叶的颜色特征数据训练SVDD单值分类器,即建立一个超球体紧紧包围住烟叶数据,再将烟叶异物混杂的特征数据输入训练好的分类器进行分类识别,把落在超球体内的样本判别为烟叶,把落在超球体外面的样本判别为异物。?
  在异物中选取橙纸、黑橡胶、、灰纸箱、红纸、黄海绵、黄皮带、绿纸这几种典型异物作为非目标样本分析。在相同摄像条件下拍摄烟叶与异物图像,并对烟叶和异物各抽取一定数量的样本点,提取出相应的RGB分量,以及HSV分量。表1和表2分别为对烟叶异物的RGB与HSV各分量的均值方差统计。?

相关热词搜索:向量 烟叶 异物 描述 检测

版权所有 蒲公英文摘 www.zhaoqt.net