有没有一个Perl统计软件包,不能一次加载整个数据集?

我正在寻找Perl(CPAN是好的)的统计数据包,允许我增量地添加数据,而不必传递整个数据数组.

只有平均值,中位数,stddev,max和min是必要的,没有什么太复杂.

原因是因为我的数据集完全太大,无法适应内存.数据源在MySQL数据库中,所以现在我只是查询数据的一部分并计算它们的统计数据,然后再结合所有可管理的子集.

如果您有其他想法如何克服这个问题,我将非常有责任!

解决方法

Statistics::Descriptive::Discrete允许您以类似于Statistics :: Descriptive的方式执行此操作,但已针对大型数据集进行了优化. (例如,文档报告内存使用量提高了两个数量级(100x)).

相关文章

忍不住在 PerlChina 邮件列表中盘点了一下 Perl 里的 Web 应用框架(巧的是 PerlBuzz 最近也有一篇相关...
bless有两个参数:对象的引用、类的名称。 类的名称是一个字符串,代表了类的类型信息,这是理解bless的...
gb2312转Utf的方法: use Encode; my $str = "中文"; $str_cnsoftware = encode("utf-8...
  perl 计算硬盘利用率, 以%来查看硬盘资源是否存在IO消耗cpu资源情况; 部份代码参考了iostat源码;...
1 简单变量 Perl 的 Hello World 是怎么写的呢?请看下面的程序: #!/usr/bin/perl print "Hello W...
本文介绍Perl的Perl的简单语法,包括基本输入输出、分支循环控制结构、函数、常用系统调用和文件操作,...