在多个列之间进行变异以创建新的变量集

问题描述我有一个国家和年份级别的面板数据集,我想在现有变量的基础上创建两个新变量。

发布:2022-10-16 标签:rdplyrpurrrnested-loopsmutation


使用dplyr、定制函数或PURR的多个条件If-Else

问题描述我有一个结构类似于以下内容的数据框:set.seed(123)df<-data_frame(SectionName=rep(letters[1:2],50),TimeSpentSeconds=sample(0:360,100,replace=TRUE),Correct=s

发布:2022-10-16 标签:rdplyrpurrr


使用lApply从列表进行预测

问题描述我正在尝试使用dplyr和lApply估计一组模型。我估计是概率回归,将结果存储在列表中。然后我想使用预测函数来预测新数据集上的值。我的模型运行,但我得到的结果是零值。我做错了什么?#Codefromtheoriginalquestionlibrary(dplyr)yea

发布:2022-10-16 标签:rlapplydplyrglmpredict


如何在dplyr中使用Slice来保留R中具有NA值的行

问题描述我有以下数据集,我想知道每个组的最小单词,如果没有最小单词(它是NA),我仍然想显示它df=data.frame(key=c("A","A","B","B","C"),word=c(1,2,3,5,NA))df%>%group_by(key)%>%slice(which.

发布:2022-10-16 标签:rslicedplyr


根据其中一列中的值向数据框添加行

问题描述当前数据框如下所示:ScenarioMonthABC11-0.5931863011.045550808-0.593816304120.1786261412.0430844320.111370583131.205779717-0.324083723-1.3977169492

发布:2022-10-16 标签:rdplyrtidyverse


不能将输入`ty`回收到R中的大小

问题描述我有这个数据框:DFV1V2P103.02.20202204.02.20203305.02.2020P205.02.2020P106.02.2020我想要此输出DFV1V2V3P103.02.2020P12204.02.2020NA3305.02.2020NAR205.0

发布:2022-10-16 标签:rsubstringdplyr


Tidyr Pivot-Wide:重复发行

问题描述我正在尝试更广泛地使用Pivot来减少数据中的行数并添加新列。但是,列数增加了,但行数保持不变。理想情况下,每个"指标"应该是一个观察值,其中DataYear、Company、Market、Country等列是相同的。我认为该问题可能是由于重复观察所致,但我不明白为什么I

发布:2022-10-16 标签:rpivotdplyrtidyr


日期:对于此非数字和非字符类型,尚未实现NAbound=True

问题描述我有此数据帧:df1<-structure(list(ID=c(1,2,2,2,3,4,5,6,6,7,8,8,9,10),dateA=structure(c(14974,18628,18628,18628,14882,16800,14882,17835,17835,16

发布:2022-10-16 标签:rdplyrna


使用dplyr、GROUP_BY WITH MUBLATE()或SUMMARM()&amp;amp;str_c()或Paste()&amp;amp;折叠连接字符串/行,但保留所有字符串(&amp;A)

问题描述使用dplyr、group_by()和mutate()或summarize()与paste()和collapse连接字符串时,NA值被强制为字符串"NA"。使用str_c()而不是paste()时,与NA连接的字符串将被删除(?str_c:每当缺少的值与另一个字符串组合时

发布:2022-10-16 标签:concatenationrdplyrcollapsena


为R中数据框的每一行返回包含缺失(NA)数据的列名列表

问题描述我正在尝试为数据帧中的每个ID#创建一个具有NA值的数据列表,以便我可以跟踪丢失的数据。我有一个数据帧,其中每一行都是一个ID#,每一列都是一个变量名。每个ID#可能有不同的缺失数据,所以我想将此信息压缩到一个两列的表中。目前,我的表如下所示:IDVar1Var2Var3

发布:2022-10-16 标签:rdplyrna