python字符串子集的所有组合

我需要字符串子集的所有组合.另外,长度为1的子集之后只能是长度> 1的子集.例如对于字符串4824,结果应该是:
[ [4,824],[4,82,4],[48,24],[482,[4824] ]

到目前为止,我设法检索所有可能的子集:

length = len(number)
    ss = []
    for i in xrange(length):
        for j in xrange(i,length):
            ss.append(number[i:j + 1])

这给了我:

['4','48','482','4824','8','82','824','2','24','4']

但我现在不知道如何将它们结合起来.

解决方法

首先,编写一个函数生成字符串的所有分区:
def partitions(s):
    if s:
        for i in range(1,len(s) + 1):
            for p in partitions(s[i:]):
                yield [s[:i]] + p
    else:
        yield []

这将迭代所有可能的第一个段(一个字符,两个字符等),并将这些段与字符串的相应剩余部分的所有分区组合在一起.

>>> list(partitions("4824"))
[['4','4'],['4','24'],'824'],['48',['482',['4824']]

现在,您可以只过滤那些符合您条件的条件,即那些没有两个连续长度为1的子串的条件.

>>> [p for p in partitions("4824") if not any(len(x) == len(y) == 1 for x,y in zip(p,p[1:]))]
[['4',['4824']]

这里,zip(p,p [1:])是迭代所有连续项对的常用方法.

更新:实际上,将约束直接合并到分区函数中也不是那么难.只需跟踪最后一段并相应地设置最小长度.

def partitions(s,minLength=1):
    if len(s) >= minLength:
        for i in range(minLength,len(s) + 1):
            for p in partitions(s[i:],1 if i > 1 else 2):
                yield [s[:i]] + p
    elif not s:
        yield []

演示:

>>> print list(partitions("4824"))
[['4',['4824']]

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...