从tiddlywiki列表传递到python列表

Tiddlywiki使用internally个以空格分隔的标签来制作标签列表.但它使用[[和]]来限制多字标签.
也就是说,foo,ram doo,bar和非常酷的列表在tiddlywiki中变成了这样的字符串:

"foo [[ram doo]] bar [[very cool]]"

我怎样才能将其转换为python列表,如下所示:

['foo','ram doo','bar','very cool']

“foo [[ram doo]] bar”.split()对我不起作用..

最佳答案
正则表达式:

import re
a = "foo [[ram doo]] bar [[very cool]] something else"
pattern = re.compile(r'\[\[[^\]]+\]\]|[^\[\] ]+')
print([i.strip(' []') for i in pattern.findall(a)])

打印[‘foo’,’ram doo’,’bar’,’非常酷’,’某事’,’其他’]

正则表达式基本上“标记”字符串(边框是[[..]]或空格,按顺序),列表推导然后从标记删除括号.

相关文章

在这篇文章中,我们深入学习了XPath作为一种常见的网络爬虫技巧。XPath是一种用于定位和选择XML文档中特...
祝福大家龙年快乐!愿你们的生活像龙一样充满力量和勇气,愿你们在新的一年里,追逐梦想,勇往直前,不...
今天在爬虫实战中,除了正常爬取网页数据外,我们还添加了一个下载功能,主要任务是爬取小说并将其下载...
完美收官,本文是爬虫实战的最后一章了,所以尽管本文着重呈现爬虫实战,但其中有一大部分内容专注于数...
JSON是一种流行的数据传输格式,Python中有多种处理JSON的方式。官方的json库是最常用的,它提供了简单...
独立样本T检验适用于比较两组独立样本的均值差异,而配对T检验则适用于比较同一组样本在不同条件下的均...