python – 多处理和多线程

之前我问了一个类似的问题,但没有得到有用的答复,所以我会努力让事情变得更清楚.

我正在寻找的是对某个linux命令运行多线程或最好是多处理方法.如果有人熟悉Picard,我想在bam文件上运行早期版本,同时在同一个bam文件上运行更新版本.我们的想法是测试新版本的速度有多快,以及它是否给出了相同的结果.

我的主要问题是我不知道如何在Popen命令上实现多处理.例如.

cmd1 = ['nice','time','java','-Xmx6G','-jar','/comparison/old_picard/MarkDuplicates.jar','I=/comparison/old.bam','O=/comparison/old_picard/markdups/old.dupsFlagged.bam','M=/comparison/old_picard/markdups/old.metrics.txt','TMP_DIR=/comparison','VALIDATION_STRINGENCY=LENIENT','ASSUME_SORTED=true']
cmd2 = ['nice','/comparison/new_picard/MarkDuplicates.jar','I=/comparison/new.bam','O=/comparison/new_picard/markdups/new.dupsFlagged.bam','M=/comparison/new_picard/markdups/new.metrics.txt','ASSUME_SORTED=true']

c1 = subprocess.Popen(cmd1,stdout=subprocess.PIPE)
c2 = subprocess.Popen(cmd2,stdout=subprocess.PIPE)

然后我有一个计时器功能

def timeit(c):
    past = time.time()
    results = [c.communicate()]
    present = time.time()
    total = present - past
    results.append(total)
    return results

我想要做的是:

p = Process(target=timeit,args=(c1,c2))
p.start()
p.join()

但是我得到“Popen object is iterable”错误.有没有人比我现在拥有更好的主意?我不想在一个完全不同的方向走,只能撞到另一面墙.总之我想在一个cpu上运行c1而在另一个c2上同时运行c2,请帮忙!

最佳答案
而不是传递subprocess.Popen(它将在首次定义时以串行方式而不是并行方式运行它们),传递命令:

import time
import subprocess
from multiprocessing import Process

cmd1 = ['nice','ASSUME_SORTED=true']

def timeit(cmd):
    print cmd
    past = time.time()
    p = subprocess.Popen(cmd,stdout=subprocess.PIPE)
    results = [p.communicate()]
    present = time.time()
    total = present - past
    results.append(total)
    return results

p1 = Process(target=timeit,args=(cmd1,))
p2 = Process(target=timeit,args=(cmd2,))

for p in (p1,p2):
    p.start()
for p in (p1,p2):
    p.join()

ETA:虽然上述解决方案通常是进行多处理的方法,但@ Jordan完全正确,你不应该使用这种方法计算两个版本的软件.为什么不顺序运行它们?

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...