正则表达式 – R字符串删除拆分时的标点符号

前端之家收集整理的这篇文章主要介绍了正则表达式 – R字符串删除拆分时的标点符号前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
假设我有一个字符串,例如以下内容.
x <- 'The world is at end. What do you think?   I am going crazy!    These people are too calm.'

我只需要在标点符号上拆分!?并跟随空白并保持标点符号.

这会删除标点符号并在分割部分中留下前导空格

vec <- strsplit(x,'[!?.][:space:]*')

如何分割留下标点符号的句子?

您可以使用perl = TRUE打开 PCRE并使用lookbehind断言.
strsplit(x,'(?<![^!?.])\\s+',perl=TRUE)

正则表达式:

(?<!          look behind to see if there is not:
 [^!?.]       any character except: '!','?','.'
)             end of look-behind
\s+           whitespace (\n,\r,\t,\f,and " ") (1 or more times)

Live Demo

原文链接:https://www.f2er.com/regex/357041.html

猜你在找的正则表达式相关文章