我有一个主模块,它试图从导入的模块中挑选一个函数,通过ssh发送它以进行unpickled并在远程机器上执行.
所以主要有:
import dill (for example) import modulea serial=dill.dumps( modulea.func ) send (serial)
在远程机器上:
import dill receive serial funcremote = dill.loads( serial ) funcremote()
如果被腌制和发送的函数是main本身定义的顶级函数,那么一切正常.当它们位于导入的模块中时,加载功能将失败,并显示“未找到模块模块”类型的消息.
模块名称似乎与功能名称一起被腌制.我没有看到任何方法来“修复”pickle以消除依赖关系,或者在接收器中创建一个虚拟模块以成为unpickling的接收者.
任何指针都将非常感激.
–prasanna
话虽如此,dill确实有一些序列化对象依赖的选项.例如,对于类实例,dill中的默认值是不通过引用序列化类实例…因此类定义也可以序列化并与实例一起发送.在dill中,您还可以(使用一个非常新的功能)通过序列化文件来序列化文件句柄,而不是通过引用来这样做.但同样,如果你有一个模块中定义的函数的情况,你就是运气不好,因为模块通过引用序列化相当普遍.
你也许可以使用dill这样做,但是,不是用于腌制对象,而是提取源并发送源代码.在pathos.pp和pyina中,我们习惯于提取任何对象(包括函数)的源和依赖关系,并将它们传递给另一个计算机/进程/等.但是,由于这不是一件容易的事情,因此dill还可以使用尝试提取相关导入的故障转移并发送而不是源代码.
你可以理解,希望这是一个混乱的杂乱的事情(正如我在下面提取的函数的一个依赖关系中所指出的).但是,您所要求的是在pathos包中成功完成,以将代码和依赖项传递到跨ssh-tunneled端口的不同计算机.
>>> import dill >>> >>> print dill.source.importable(dill.source.importable) from dill.source import importable >>> print dill.source.importable(dill.source.importable,source=True) def _closuredsource(func,alias=''): """get source code for closured objects; return a dict of 'name' and 'code blocks'""" #FIXME: this entire function is a messy messy HACK # - pollutes global namespace # - fails if name of freevars are reused # - can unnecessarily duplicate function code from dill.detect import freevars free_vars = freevars(func) func_vars = {} # split into 'funcs' and 'non-funcs' for name,obj in list(free_vars.items()): if not isfunction(obj): # get source for 'non-funcs' free_vars[name] = getsource(obj,force=True,alias=name) continue # get source for 'funcs' #…snip… …snip… …snip… …snip… …snip… # get source code of objects referred to by obj in global scope from dill.detect import globalvars obj = globalvars(obj) #XXX: don't worry about alias? obj = list(getsource(_obj,name,force=True) for (name,_obj) in obj.items()) obj = '\n'.join(obj) if obj else '' # combine all referred-to source (global then enclosing) if not obj: return src if not src: return obj return obj + src except: if tried_import: raise tried_source = True source = not source # should never get here return
我想也可以围绕dill.detect.parents方法构建一些东西,它提供了一个指向任何给定对象的所有父对象的指针列表……并且可以将任何函数的所有依赖关系重建为对象……但是这没有实现.
顺便说一句:建立一个ssh隧道,就这样做:
>>> t = pathos.Tunnel.Tunnel() >>> t.connect('login.university.edu') 39322 >>> t Tunnel('-q -N -L39322:login.university.edu:45075 login.university.edu')
然后,您可以使用ZMQ或ssh或其他任何方式跨本地端口工作.如果你想用ssh这样做,那么pathos也有内置的功能.