频道导航

折叠/连接/聚合列到每个组中的单个逗号分隔的字符串

2020-06-28 设计模式前端之家

前端之家收集整理的这篇文章主要介绍了折叠/连接/聚合列到每个组中的单个逗号分隔的字符串，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我想根据两个分组变量在数据框中聚合一列，并用逗号分隔各个值。

这里有一些数据：

data <- data.frame(A = c(rep(111,3),rep(222,3)),B = rep(1:2,C = c(5:10))
data
#     A B  C
# 1 111 1  5
# 2 111 2  6
# 3 111 1  7
# 4 222 2  8
# 5 222 1  9
# 6 222 2 10

“A”和“B”是分组变量，“C”是我要折叠成逗号分隔的字符串的变量。我努力了：

library(plyr)
ddply(data,.(A,B),summarise,test = list(C))

    A B  test
1 111 1  5,7
2 111 2     6
3 222 1     9
4 222 2 8,10

但是当我尝试将测试列转换为字符时，它变成如下：

ddply(data,test = as.character(list(C)))
#     A B     test
# 1 111 1  c(5,7)
# 2 111 2        6
# 3 222 1        9
# 4 222 2 c(8,10)

如何保留字符格式并用逗号分隔？例如，第1行应该只有“5,7”，而不是c(5,7)。

plyr尝试使用toString：

# plyr
library(plyr)
ddply(data,summarize,C = toString(C))

这里还有一些额外的替代方法也使用toString：

data.table

# alternative using data.table
library(data.table)
as.data.table(data)[,toString(C),by = list(A,B)]

聚合这不使用包：

# alternative using aggregate from the stats package in the core of R
aggregate(C ~.,data,toString)

这里是使用sql 功能group_concat使用sqldf package的另一种方法：

library(sqldf)
sqldf("select A,B,group_concat(C) C from data group by A,B",method = "raw")

dplyr替代品：

library(dplyr)
data %>%
  group_by(A,B) %>%
  summarise(test = toString(C)) %>%
  ungroup()

原文链接：https://www.f2er.com/javaschema/282142.html

上一篇：限制聚合到过滤器的结果下一篇：红宝石 – 宝石依赖版本的含义

猜你在找的设计模式相关文章

适配器模式-让不兼容的接口得以适配

适配器模式将一个类的接口转换成客户期望的另一个接口，使得原本接口不兼容的类可以相互合...

作者：前端之家时间：2021-02-24

策略模式-定义一个算法族

策略模式定义了一系列算法族，并封装在类中，它们之间可以互相替换，此模式让算法的变化独...

作者：前端之家时间：2021-02-24

设计模式之高质量代码

设计模式讲的是如何编写可扩展、可维护、可读的高质量代码，它是针对软件开发中经常遇到的...

作者：前端之家时间：2021-02-24

模板方法模式-封装一套算法流程

模板方法模式在一个方法中定义一个算法的骨架，而将一些步骤延迟到子类中，使得子类可以在...

作者：前端之家时间：2021-02-24

迭代器模式-统一集合的遍历方式

迭代器模式提供了一种方法，用于遍历集合对象中的元素，而又不暴露其内部的细节。

作者：前端之家时间：2021-02-24

单例模式的五种实现方式及优缺点

单例模式（Singleton Design Pattern）保证一个类只能有一个实例，并提供一个全局访问点。

作者：前端之家时间：2021-02-24

组合模式-统一的处理个别对象与组合对象

组合模式可以将对象组合成树形结构来表示“整体-部分”的层次结构，使得客户可以用一致的方...

作者：前端之家时间：2021-02-24

装饰者模式-动态的包装原有对象的行为

装饰者模式能够更灵活的，动态的给对象添加其它功能，而不需要修改任何现有的底层代码。

作者：前端之家时间：2021-02-24

观察者模式-将消息通知给观察者

观察者模式（Observer Design Pattern）定义了对象之间的一对多依赖，当对象状态改变的时候...

作者：前端之家时间：2021-02-24

代理模式-访问对象的代理而非其本身

代理模式为对象提供一个代理，来控制对该对象的访问。代理模式在不改变原始类代码的情况下...

作者：前端之家时间：2021-02-24

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章