如何根据R中两列不匹配的值对数据帧进行子集?

问题描述我有一个由3个COLS组成的数据帧:tweet_id|response_id|time1222:10:472NA22:10:133122:08:274321:54:495421:49:356521:46:236721:46:238921:30:458621:30:4581

发布:2022-10-16 标签:rdplyrtidyverse


在GROUP_BY()之后获取count()以查找非缺失值

问题描述我有一些缺少值的数据(即NA值),简化格式如下(最后输入的代码):#>idxcountry#>112.0USA#>224.0USA#>333.5JPN#>44NAJPN对于每个国家,我想取x的平均值和x的可用值的计数(即不是NA),所以我使用了group_by,它适用于m

发布:2022-10-16 标签:rdplyrtidyverse


使用变量块旋转更长时间

问题描述在变量块上使用pivot_longer时遇到问题。假设我有这个:我想要这个:dfwide<-structure(list(date=structure(c(1577836800,1577923200,1578009600,1578096000,1578182400,157

发布:2022-10-16 标签:rdplyrreshapetidyverse


在嵌套数据帧内应用Purrr::Map()时出现问题

问题描述我正在学习HadleyWickham的RforDataSciencehttps://r4ds.had.co.nz/many-models.html的第25章"多种模型",但在重新创建25.2.2中的示例时遇到了问题。以下是我到目前为止所拥有的(以及正在运行的):requi

发布:2022-10-16 标签:rdplyrtidyrtidyversepurrr


根据列名中的字符串变异新列并从现有列粘贴值

问题描述我有此数据帧:df<-structure(list(number=1:3,a_1=c(1L,4L,7L),a_2=c(2L,5L,8L),a_3=c(3L,6L,9L)),class="data.frame",row.names=c(NA,-3L))numbera_1a_

发布:2022-10-16 标签:rstring-matchingdplyrtidyverse


R中选定列的行式平均值

问题描述让我们在著名的iris数据集上演示这个问题。我需要按行应用选定的函数,但仅在选定的列上应用。示例如下:library(tidyverse)iris%>%mutate_at(.funs=scale,.vars=vars(-c(Species)))%>%rowwise()%>

发布:2022-10-16 标签:rdplyrtidyverse


阅读列表,擅长研发,然后执行操作

问题描述我不确定如何在R中复制代码或列表,希望我的图像能够传达这个问题。我在EXCEL中有几列(长度不均),我想创建一个最后一列,从每一列和创建一个列表1值。(如果您可以包含关于如何从EXCEL中读取R中的此类数据的代码,这也会很有帮助。)添加数据结构df<-structure(

发布:2022-10-16 标签:listrdplyrtidyverse


如何在PIVOT_WIDTER中而不是列表中获得总值的总和?

问题描述data<-data.frame(row_id=0:19,Prediction=c(4.20631885375613,0.677197140556434,0.889543113836738,37.8093227242093,105.860956599905,17.2609

发布:2022-10-16 标签:rdplyrtidyverse


如何让n()不在行云流水中太多呢?

问题描述考虑下面的MWE,其中Amt表示每个Food项的不同数量(从1到40),另一个变量表示该食品项的Site。我想要食品的汇总中位数和计数n(),但没有NA的。MWEmwe<-data.frame(Site=sample(rep(c("Home","Office"),size

发布:2022-10-16 标签:rdplyrtidyversena


与if和is.na交叉突变

问题描述我有下面列出的格式的数据,其中我需要处理的所有变量都是NA或变量的名称,我需要将Nas更改为0,将字符串更改为1。我尝试使用dplyr::across()和ifelse(),但返回的都是1。我目前唯一有效的解决方案是分别对每个变量进行变异。如何同时将多个变量中的所有NA更

发布:2022-10-16 标签:rdplyrnaacross