我有一个分配给名为’temps’的变量的数据集,它有’date’,’temperature’,’country’列.
我想做这样的事情,我可以在sql中做
我想做这样的事情,我可以在sql中做
- SELECT * FROM temps WHERE country != 'mycountry'
如何在R中进行类似的选择?
解决方法
我们可以在基R中使用类似的语法
- temps[temps$country != "mycountry",]
基准
- set.seed(24)
- temps1 <- data.frame(country = sample(LETTERS,1e7,replace=TRUE),val = rnorm(1e7))
- system.time(temps1[!temps1$country %in% "A",])
- # user system elapsed
- # 0.92 0.11 1.04
- system.time(temps1[temps1$country != "A",])
- # user system elapsed
- # 0.70 0.17 0.88
如果我们使用包解决方案