reset_index()默认将MultiIndex所有层级转为列并重置为整数索引;可指定level参数展开部分层级;列名含元组时需用map('_'.join)或列表推导式扁平化;索引无名则生成level_0等默认列名,建议预先命名。
reset_index
() 直接展开多级索引只要索引是 MultiIndex,reset_index() 就会自动把所有层级转成普通列,这是最简、最常用的写法。
它不区分索引层级数量,也不需要指定哪一层——全转,一步到位。
reset_index(level=[...]) 显式指定层级编号或名称reset_index() 会自动在列名后加 _ 后缀(如 col_)避免冲突map(str) 或 join 扁平化列名有时你调用 reset_index() 后发现新列名是元组,比如 ('A', 'X'),这是因为原始 MultiIndex 的列本身也是多级的(即 columns 是 MultiIndex)。这时 reset_index() 不起作用,要处理的是列名本身。
df.columns = df.columns.map('_'.join) 把元组列名拼成字符串(如 ('A', 'X') → 'A_X')df.columns = ['_'.join(col).strip() if isinstance(col, tuple) else col for col in df.columns] 避免非元组列报错map(str) 会保留括号和逗号(如 "('A', 'X')"),一般不推荐reset_index(level=...)
不是所有场景都要全展开。比如你只关心第一层索引(如年份),其他层级(如月份、地区)只是分组中间态,可以只提一层出来。
df.reset_index(level=0):只展开第 0 层索引(最外层)df.reset_index(level='year'):按索引名称展开,前提是该层有名字df.reset_index(level=[0, 2]):展开第 0 和第 2 层,跳过第 1 层reset_index())常见坑:reset_index() 后出现 level_0、level_1 这类默认名,说明原始 MultiIndex 没设名字。这会让后续筛选、引用列变得麻烦。
pd.MultiIndex.from_tuples([...], names=['country', 'year'])
df.index.names = ['country', 'year'],再 reset_index() 就会生成对应列名df = df.reset_index().rename(columns={'level_0': 'country', 'level_1': 'year'})