python – subprocess.call不等待进程完成

根据 Python文档,subprocess.call应该阻塞并等待子进程完成.在这段代码中,我试图通过在命令行上调用Libreoffice将少量xls文件转换为新格式.我假设对子进程调用调用是阻塞的,但似乎我需要在每次调用添加一个人工延迟,否则我会错过out目录中的几个文件.

我究竟做错了什么?为什么我需要延迟?

from subprocess import call

for i in range(0,len(sorted_files)):
            args = ['libreoffice','-headless','-convert-to','xls',"%s/%s.xls" %(sorted_files[i]['filename'],sorted_files[i]['filename']),'-outdir','out']
            call(args)
            var = raw_input("Enter something: ") # if comment this line I dont get all the files in out directory

编辑通过以下评论可能很难找到答案.我使用unoconv进行文件转换,这种转换阻塞并且易于使用脚本.

@R_404_323@

问题是soffice命令行工具(libreoffice只是一个链接,或者是另一个包装器)只是真实程序soffice.bin的“控制器”.它找到soffice.bin的运行副本和/或创建on,告诉它做一些工作,然后退出.

因此,调用正在做正确的事情:它等待libreoffice退出.

但你不想等待libreoffice退出,你想等soffice.bin完成libreoffice要求它做的工作.

看起来你正在尝试做的事情是不可能直接做的.但它可以间接地做.

docs说无头模式:

… allows using the application without user interface.

This special mode can be used when the application is controlled by external clients via the API.

换句话说,在运行一些UNO字符串/进行一些转换/在命令行上指定的任何其他内容后,应用程序不会退出,它会等待来自外部的更多UNO命令,而启动器只是在发送时立即运行应用程序的相应命令.

您可能必须直接使用上述外部控制API(UNO).

有关基础知识,请参阅Scripting LibreOffice(尽管有关于内部脚本的信息比外部更多),有关详细信息和示例,请参阅API documentation.

但是可能有一个更简单的答案:unoconv是一个使用UNO API编写的简单命令行工具,它完全符合您的要求.如有必要,它会启动LibreOffice,发送一些命令,等待结果,然后退出.因此,如果您只使用unoconv而不是libreoffice,则只需拨打电话即可.

另请注意,unoconv是用Python编写的,旨在用作模块.如果您只是导入它,您可以编写自己的(更简单,特定于用例)代码来替换“Main entrance”代码,而根本不使用子进程. (或者,当然,您可以撕开模块并自己使用相关代码,或者只是将它用作从Python中使用UNO的非常好的示例代码.)

此外,上面链接的unoconv页面列出了各种其他类似工具,一些通过UNO工作,一些不工作,所以如果它不适合你,请尝试其他工具.

如果没有其他工作,你可以考虑,例如,创建一个sentinel文件和使用文件系统监视,所以至少你将能够准确地检测它何时完成其工作,而不必猜测超时.但这是一个真正的最后沟渠解决方案,在消除所有其他选项之前,您甚至不应该考虑这个问题.

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...