如何防止Groupby超越指数？

人气：49 发布：2023-01-03 标签： python pandas multi-index

问题描述

假设您有以下半MultiIndex object

import pandas as pd
df = pd.DataFrame({
    'c': {
        ('r', 'r1'): 1.,
        ('r', 'r2'): 2.,
    },
})
print(df)
#       c
# r r1  1
#   r2  2

让我们重点关注分层索引，即垂直索引。首先，请注意，正如预期的那样，我们拥有

>>> df.index.__class__.__name__
'MultiIndex'

重点是pandas.DataFrame.groupby可能-classdf.index取决于最终的级数是否为1。

>>> dfg = df.groupby(axis=0, level=0).sum()
>>> dfg.index.__class__.__name__
'Index'

防止/纠正此类行为的最干净方法是什么？目前，我同意

>>> dfg.index = pd.Index((c,) for c in dfg.index)  # Doing so is equivalent to using `pd.MultiIndex.from_tuples`
>>> dfg.index.__class__.__name__
'MultiIndex'

为什么？查看评论：没有XY问题...

假设您要将求和的值传播到更低的级别。SO上提出的解决方案都不适合我。可读性不足和/或隐藏了有趣的临时计算。原来，在源和处理MultiIndex实例时，执行此类传播变得相当容易。

>>> df_            = df.copy()  # copy for the sake of illustration
>>> df_.iloc[:, :] = dfg  # Actually equivalent to `df_.update(dfg)`
>>> df_
      c
r r1  3
  r2  3
# whereas without correction:
#        c
# r r1 nan
#   r2 nan

NB：此方法适用于所有dfg.index.nlevels。

推荐答案

尝试使用pd.DataFrame.align：

df.align(dfg, level=0)

输出：

(        c
 r r1  1.0
   r2  2.0,
         c
 r r1  3.0
   r2  3.0)

注意：每个数据帧具有相同索引的元组。

然后，

 pd.concat(list(df.align(dfg, level=0)), axis=1)

然后您可以获得连接的数据帧，如下所示：

        c    c
r r1  1.0  3.0
  r2  2.0  3.0

上一篇：函数在多索引 pandas 数据帧中的应用

下一篇：在多索引中排序日期(&Q)

最近更新

为什么没有为UNCalendarNotificationTrigger触发本地通知 2023-01-03
SwiftUI-为什么我的TabBar忽略了init()中的设置颜色方法？ 2023-01-03
IOS画外音功能随捆绑包标识符而变化 2023-01-03
选项卡栏中间的选项卡角外 2023-01-03
将UIView控制器推送到UITabBar上方 2023-01-03
Apple App Loader/iTunes Connect问题(Apple ID无权访问iTunes Connect&) 2023-01-03
将Formik与打字稿(离子)配合使用 2023-01-03
在Formik中设置单选按钮组的初始值 2023-01-03
如何在Formick中使用REACTION数字格式 2023-01-03
使用&lt；Field数组/&gt；中的自定义组件，通过表单&lt；字段/&gt；设置&lt；Textfield/&gt；的值。 2023-01-03
Redux在Reaction中添加了另一个Aray内的对象数组 2023-01-03
两种情况在什么时候在YUP中反应 2023-01-03
当Formik表单更改时更新另一个组件 2023-01-03
Formik验证正在提交/isValiating未设置为True 2023-01-03
基于另一个字段值的必填字段-Formik，Yup 2023-01-03
如何使用Formik调用onChange中的两个函数 2023-01-03
YUP：验证可以为空的字符串数组 2023-01-03
如何防止Enter键触发提交 2023-01-03
使用Formik的Reaction验证最大范围 2023-01-03
材质用户界面切换按钮-选中时不能更改背景颜色 2023-01-03
使用Formik和YUP的Reaction-Date Picker：未在第一个模糊时验证日期值，而不是.Required() 2023-01-03
YUP/Formik带去反跳的异步验证 2023-01-03
对多个值进行YUP验证 2023-01-03
使用Formik、Yup和Reaction进行异步验证 2023-01-03
使用YUP检查字符串或数字长度的验证 2023-01-03
如何在Formik中禁用提交时的自动重置表单？ 2023-01-03
更新Formik表单上的初始值属性不会更新输入值 2023-01-03
如何在YUP异步验证中设置动态错误消息？ 2023-01-03
Formik+Yup：如何在提交前立即验证表单？ 2023-01-03
有两个相关字段的YUP验证 2023-01-03