用相邻行而不是列中的值替换行中的NA

人气:361 发布:2022-10-16 标签: r dataframe na

问题描述

原始数据:

    V1 V2
1   c1  a
2   c2  b
3 <NA>  c
4 <NA>  d
5   c3  e
6 <NA>  f
7   c4  g

可重复的样本数据

V1 = c('c1','c2',NA,NA,'c3',NA,'c4')
V2 = c('a','b','c','d','e','f','g')

data.frame(V1,V2)

预期产量

  V1_after V2_after
1       c1        a
2       c2    b c d
3       c3      e f
4       c4        g
V1_after <- c('c1','c2','c3','c4')
V2_after <- c('a',paste('b','c','d'),paste('e','f'),'g')

data.frame(V1_after,V2_after)

这是示例数据。 在Real Data中,V1中NA不规则的行

对我来说太难了

推荐答案

您可以使用zoo::na.locf来执行此操作。它获取最新的非NA值,并填充途中的所有NA值:

library(dplyr)
library(zoo)

df %>%
  mutate(V1 = zoo::na.locf(V1)) %>%
  group_by(V1) %>%
  summarise(V2 = paste0(V2, collapse = " "))

# A tibble: 4 x 2
  V1    V2   
  <chr> <chr>
1 c1    a    
2 c2    b c d
3 c3    e f  
4 c4    g 

440