利用HOG+SVM训练自己的XML文件

http://blog.csdn.net/Armily/article/details/8333862 原文链接

在人脸检测中，我们一般利用训练好的XML文件去预测图像中是否存在人脸，那么XML文件是如何得到的，按照人脸的XML文件，它应该是提取样本的Haar特征，利用某个机器学习方法，最终得到的。本文主要讨论如何得到自己的XML文件。

@H_404_9@ 在机器学习中，首先应该是采集样本，然后提取他们的特征，本人主要利用HOG特征进行实验。

@H_404_9@1、采集样本图像（正样本和负样本），将其归一化到一个的尺度，如48X48.

@H_404_9@2、将样本图像的名称写到一个TXT文件，方便程序调用.

@H_404_9@3、依次提取每张图像的HOG特征向量.

@H_404_9@4、利用SVM进行训练.

@H_404_9@5、得到XML文件

@H_404_9@具体代码如下：

@H_404_9@HOG特征向量计算方法：

利用矩形HOG结构，2×2个cell组成一个block块，每个cell由8×8像素的图像区域组成，步长N为8，而每个cell的梯度方向从0⁰-360⁰分成9个方向块。对于0⁰-180⁰的方向均匀投影到9个方向块，比如0⁰-20⁰投影到a₁块，20⁰-40⁰投影到a₂块。也就是说每个cell要对9维的特征进行梯度幅度投影，形成9维的特征向量，block内的四个cell独立产生9维的特征向量，计算某个cell的特征向量时，投影的时候同一个block内的另外三个cell中的像素也要对这个cell的特征向量进行投影，投影的权重使用三线性插值方法，这样在48×48的图片大小下，利用公式N = ((W–w_b)/stride +1)*((H-h_b)/stride+1)*bins*n，

其中W为图片的宽，H为图片的高，w_b和h_b为block的宽与高，stride为cell的大小，bins为投影的区块，n为一个block中包含的cell的个数。

就产生900维的特征向量。

[html]view plaincopy 
   
 //////////////////extractthehogfeaturefromimages//////////////////////////////////////////////////////////////
 #defineHOG_VECTOR900//图像HOG特征向量((48-16)/8+1)*(48-16)/8+1)*9*4=900
 #defineTRAIN_IMG_NUM800//总共的样本（图像）数
 HOGDescriptorhog(cvSize(48,48),cvSize(16,16),cvSize(8,8),9,1,-1,HOGDescriptor::L2Hys,0.2,false,HOGDescriptor::DEFAULT_NLEVELS);//初始化HOG描述符
 vector<float>descrip;
 vector>totaldescrip(HOG_VECTOR*TRAIN_IMG_NUM);//将所有HOG特征向量保存在vector中
>::iteratorpos;
 pos=totaldescrip.begin();
 intImageNum=0;
 Matimg;
 FILE*f="pictures.txt";//存放样本图像
 
 char_filename[1024];
 for(;;)
 {
 char*filename=_filename;
 if(f)
 {
 if(!fgets(filename,(int)sizeof(_filename)-2,f))
 break;
 //while(*filename&&isspace(*filename))
 //++filename;
 if(filename[0]=='#')
 continue;
 intl=strlen(filename);
 while(l>0&&isspace(filename[l-1]))
 --l;
 filename[l]='\0';
 img=imread(filename);
 }
 printf("%s:\n",filename);
 if(!img.data)
 continue;
 
 fflush(stdout);
 hog.compute(img,descrip);//计算每幅图像的HOG特征向量
>::iteratoriter;
 for(iter=descrip.begin();iter!=descrip.end();iter++,pos++)
 *pos=*iter;
 }
 float*buf2=&totaldescrip[0];
 Matdata_mat(TRAIN_IMG_NUM,HOG_VECTOR,CV_32FC1,buf2);
 //将图像标记为两类：1->正样本；2->负样本
 Matres_mat=Mat::ones(TRAIN_IMG_NUM,CV_32SC1);
 for(intk=400;k800;k++)
 res_mat.atunsignedint>(k,0)=2;
 //利用SVM进行训练,生成XML文件
 TermCriteriacriteria;
 SVMsvm=SVM();
 SVMParamsparam;
 criteria=cvTermCriteria(CV_TERMCRIT_EPS,1000,FLT_EPSILON);
 param=SVMParams(SVM::C_SVC,SVM::LINEAR,10.0,0.09,1.0,0.5,NULL,criteria);
 svm.train(data_mat,res_mat,Mat(),param);
 svm.save("svm_image.xml");

预测的代码：

copy 
    
   

利用HOG+SVM训练自己的XML文件

猜你在找的XML相关文章