随机森林不在opencv python(cv2)中工作

我似乎无法正确传递参数来从python中训练opencv中的随机森林分类器.

我在C中编写了一个正常工作的实现,但在python中得不到相同的结果.

我在这里找到了一些示例代码http://fossies.org/linux/misc/opencv-2.4.7.tar.gz:a/opencv-2.4.7/samples/python2/letter_recog.py

这似乎表明你应该传入dict中的参数.这是我正在使用的代码

rtree_params = dict(max_depth=11,min_sample_count=5,use_surrogates=False,max_categories=15,calc_var_importance=False,n_active_vars=0,max_num_of_trees_in_the_forest=1000,termcrit_type=cv2.TERM_CRITERIA_MAX_ITER)
classifier = cv2.RTrees()
classifier.train(train_data,cv2.CV_ROW_SAMPLE,label_data,params=rtree_params);

我可以说分类器正在接受正确的训练,但它并不像我在C中使用相同参数训练的那样准确.我相当肯定参数已被确认,因为当我调整值时,我会得到不同的结果.

我注意到当我将分类输出文件时,它只有一棵树.我很确定这是问题所在.我看了一下openCV实现:

http://www.code.opencv.org/svn/gsoc2012/denoising/trunk/opencv-2.4.2/modules/ml/src/rtrees.cpp

根据我的参数,它应该输出一个有1000棵树的森林.我尝试将max_num_of_trees_in_the_forest参数设置为各种疯狂值,并且它没有改变OpenCV的行为.

思考?

最佳答案
不确定这是否会有所帮助,但我相信:

n_active_vars=0

应该

nactive_vars=0

此外,您可能希望尝试使用term_crit参数进行试验.
例如,尝试添加

term_crit=(cv2.TERM_CRITERIA_MAX_ITER,1000,1)

进入你的字典.

我相信这将设置在1000棵树添加到森林中时终止的标准.

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...