我有以下数据集
> head(names$SAMPLE_ID) [1] "Bacteria|Proteobacteria|Gammaproteobacteria|Pseudomonadales|Moraxellaceae|Acinetobacter|" [2] "Bacteria|Firmicutes|Bacilli|Bacillales|Bacillaceae|Bacillus|" [3] "Bacteria|Proteobacteria|Gammaproteobacteria|Pasteurellales|Pasteurellaceae|Haemophilus|" [4] "Bacteria|Firmicutes|Bacilli|Lactobacillales|Streptococcaceae|Streptococcus|" [5] "Bacteria|Firmicutes|Bacilli|Lactobacillales|Streptococcaceae|Streptococcus|" [6] "Bacteria|Firmicutes|Bacilli|Lactobacillales|Streptococcaceae|Streptococcus|"
我想提取||之间的最后一个字作为一个新的变量即
Acinetobacter Bacillus Haemophilus
我试过用
library(stringr) names$sample2 <- str_match(names$SAMPLE_ID,"|.*?|")
我们可以用
原文链接:https://www.f2er.com/regex/356879.htmllibrary(stringi) stri_extract_last_regex(v1,'\\w+') #[1] "Acinetobacter"
数据
v1 <- "Bacteria|Proteobacteria|Gammaproteobacteria|Pseudomonadales|Moraxellaceae|Acinetobacter|"