使用gitpython获取更改的文件

我想获得当前git-repo的已更改文件列表.这些文件通常列在“更改”下,不会进行提交:调用git status时.

到目前为止,我已设法连接到存储库,将其拉出并显示所有未跟踪的文件

from git import Repo
repo = Repo(pk_repo_path)
o = self.repo.remotes.origin
o.pull()[0]
print(repo.untracked_files)

但现在我想显示所有有变化的文件(未提交).任何人都能把我推向正确的方向吗?我查看了回购方法名称并进行了一段时间的实验,但我找不到正确的解决方案.

显然我可以调用repo.git.status并解析文件,但这根本不优雅.必须有更好的东西.

编辑:现在我考虑一下.更有用的是一个函数,它告诉我单个文件的状态.喜欢:

print(repo.get_status(path_to_file))
>>untracked
print(repo.get_status(path_to_another_file))
>>not staged

解决方法

@H_404_17@
for item in repo.index.diff(None):
    print item.a_path

或者只获得清单:

changedFiles = [ item.a_path for item in repo.index.diff(None) ]

repo.index.diff()返回http://gitpython.readthedocs.io/en/stable/reference.html#module-git.diff中描述的git.diff.Diffable

所以函数看起来像这样:

def get_status(repo,path):
    changed = [ item.a_path for item in repo.index.diff(None) ]
    if path in repo.untracked_files:
        return 'untracked'
    elif path in changed:
        return 'modified'
    else:
        return 'don''t care'

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...