删除某些列上的重复行,并汇总数据。

我有一些数据。这里有一个虚拟数据框架作为例子。

%ignore_pre_1%

enter image description here

如果你看REFERENCE A, Google有一个DIRECT和一个INDIRECT付款;在REFERENCE E, Paypal有一个间接和直接付款。

我需要去掉REFERENCE和COMPANY上的重复。例如,对于Google,我只需要在Reference A上有一行,直接付款在DirectPayment栏中,间接付款在IndirectPayment栏中,即。

anged

我怎么做呢?我已经尝试过pivot_wide,但不是,这并不完全是我需要在这里。

谢谢你

解决方案:

那这个呢?

library(dplyr)
df %>% 
  group_by(Reference, Company) %>% 
  summarise_if(is.numeric, sum, na.rm = TRUE)

它给出了。

# A tibble: 6 x 5
# Groups:   Reference [5]
  Reference Company Payments DirectPayment IndirectPayment
  <fct>     <fct>      <dbl>         <dbl>           <dbl>
1 A         Google      1250           500             750
2 A         Xbox         100           100               0
3 B         Nike        2000          2000               0
4 C         Apple       1100          1100               0
5 D         Samsung      450             0             450
6 E         Paypal      1000           100             900

本文来自投稿,不代表运维实战侠立场,如若转载,请注明出处:https://www.shizhanxia.com/877.html

(0)
上一篇 2022年6月29日 下午4:01
下一篇 2022年6月29日 下午4:01

相关推荐

发表评论

登录后才能评论