pandas.Index#
- class pandas.Index(data=None, dtype=None, copy=False, name=None, tupleize_cols=True)[源代码][源代码]#
用于索引和对齐的不可变序列。
存储所有 pandas 对象的轴标签的基本对象。
在 2.0.0 版本发生变更: 索引可以包含所有 numpy 数值类型(除了 float16)。以前只接受 int64/uint64/float64 类型。
- 参数:
- 数据类数组(一维)
一个包含索引数据的类似数组的结构。这可以是 Python 列表、NumPy 数组或 pandas Series。
- dtypestr, numpy.dtype, 或 ExtensionDtype, 可选
输出索引的数据类型。如果未指定,这将根据 data 推断。更多用法请参见 用户指南。
- 复制布尔值, 默认为 False
复制输入数据。
- 名字对象
要存储在索引中的名称。
- tupleize_colsbool (默认: True)
当为 True 时,如果可能,尝试创建一个 MultiIndex。
参见
RangeIndex
实现单调整数范围的索引。
CategoricalIndex
Categorical
的索引。MultiIndex
一个多级别的,或层次化的索引。
IntervalIndex
一个
区间
的索引。DatetimeIndex
datetime64 数据的索引。
TimedeltaIndex
timedelta64 数据的索引。
PeriodIndex
周期数据索引。
备注
一个 Index 实例 只能 包含可哈希对象。一个 Index 实例 不能 持有 numpy float16 数据类型。
例子
>>> pd.Index([1, 2, 3]) Index([1, 2, 3], dtype='int64')
>>> pd.Index(list("abc")) Index(['a', 'b', 'c'], dtype='object')
>>> pd.Index([1, 2, 3], dtype="uint8") Index([1, 2, 3], dtype='uint8')
属性
返回转置,根据定义这是自身。
支持此 Series 或 Index 的数据的 ExtensionArray。
返回底层数据的 dtype 对象。
指示索引是否为空。
检查索引是否有重复值。
如果存在任何 NaN,则返回 True。
返回从值推断出的类型字符串。
如果值相等或递减,则返回一个布尔值。
如果值相等或递增,则返回一个布尔值。
如果索引具有唯一值,则返回。
返回 Index 或 MultiIndex 名称。
获取索引中的名称。
返回底层数据中的字节数。
底层数据维度的数量,定义为1。
nlevels
层数。
返回基础数据形状的元组。
返回基础数据中的元素数量。
返回一个表示索引中数据的数组。
方法
all
(*args, **kwargs)返回所有元素是否为真值。
any
(*args, **kwargs)返回是否有任何元素为真值。
追加
(其他)将一系列索引选项附加在一起。
argmax
([axis, skipna])返回 Series 中最大值的整数位置。
argmin
([axis, skipna])返回 Series 中最小值的整数位置。
argsort
(*args, **kwargs)返回将排序索引的整数索引。
asof
(label)返回索引中的标签,如果不存在,则返回前一个标签。
asof_locs
(where, mask)返回索引中标签的位置(索引)。
astype
(dtype[, copy])创建一个带有转换为 dtypes 的值的索引。
复制
([name, deep])复制这个对象。
删除
(loc)通过删除传递的位置(-s)创建新的索引。
diff
([periods])计算 Index 对象中连续值之间的差异。
差集
(other[, sort])返回一个新的索引,其中包含在索引中但不在 other 中的元素。
drop
(labels[, errors])使用传递的标签列表创建新的索引并删除。
drop_duplicates
(*[, keep])返回删除了重复值的索引。
droplevel
([level])返回移除了请求级别的索引。
dropna
([how])返回不包含 NA/NaN 值的索引。
重复的
([keep])指示重复的索引值。
等于
(other)确定两个 Index 对象是否相等。
factorize
([sort, use_na_sentinel])将对象编码为枚举类型或分类变量。
fillna
(value)用指定值填充 NA/NaN 值。
get_indexer
(target[, method, limit, tolerance])计算给定当前索引的新索引的索引器和掩码。
get_indexer_for
(target)即使在非唯一情况下,也保证返回一个索引器。
get_indexer_non_unique
(target)计算给定当前索引的新索引的索引器和掩码。
get_level_values
(level)返回请求级别的值索引。
get_loc
(key)获取请求标签的整数位置、切片或布尔掩码。
get_slice_bound
(label, side)计算对应于给定标签的切片边界。
groupby
(values)根据给定的值数组对索引标签进行分组。
相同
(其他)类似于等于,但还会检查对象属性和类型是否也相等。
infer_objects
([copy])如果我们有一个对象数据类型,尝试推断一个非对象数据类型。
插入
(loc, item)在指定位置插入新项目创建新索引。
交集
(other[,sort])形成两个索引对象的交集。
is_
(其他)更灵活,更快的检查,类似于
is
但可以通过视图工作。isin
(values[, level])返回一个布尔数组,其中索引值在 values 中。
isna
()检测缺失值。
isnull
()检测缺失值。
项目
()将底层数据的第一个元素作为Python标量返回。
join
(other, *[, how, level, ...])计算 join_index 和索引器以使数据结构符合新索引。
map
(mapper[, na_action])使用输入映射或函数映射值。
最大值
([axis, skipna])返回索引的最大值。
memory_usage
([deep])值的内存使用情况。
最小值
([axis, skipna])返回索引的最小值。
notna
()检测现有的(非缺失的)值。
notnull
()检测现有的(非缺失的)值。
nunique
([dropna])返回对象中唯一元素的数量。
putmask
(mask, value)返回一个用掩码设置的值的新索引。
ravel
([order])返回一个对自身的视图。
reindex
(目标[, 方法, 层级, 限制, ...])使用目标的值创建索引。
重命名
(name, *[, inplace])更改索引或 MultiIndex 名称。
repeat
(repeats[, axis])重复索引的元素。
round
([decimals])将索引中的每个值四舍五入到给定的位数。
searchsorted
(value[, side, sorter])查找元素应插入以保持顺序的索引。
set_names
(names, *[, level, inplace])设置索引或复合索引的名称。
shift
([periods, freq])按所需的时间频率增量数移动索引。
slice_indexer
([start, end, step])计算输入标签和步长的切片索引器。
slice_locs
([start, end, step])计算输入标签的切片位置。
sort_values
(*[, return_indexer, ascending, ...])返回索引的排序副本。
sortlevel
([level, ascending, ...])为了与索引API的内部兼容。
symmetric_difference
(other[, result_name, sort])计算两个 Index 对象的对称差集。
take
(indices[, axis, allow_fill, fill_value])返回由索引选择的值的新索引。
to_flat_index
()身份方法。
to_frame
([index, name])创建一个包含索引列的 DataFrame。
to_list
()返回一个值的列表。
to_numpy
([dtype, copy, na_value])表示此 Series 或 Index 中值的 NumPy ndarray。
to_series
([index, name])创建一个索引和值都等于索引键的序列。
tolist
()返回一个值的列表。
转置
(*args, **kwargs)返回转置,根据定义这是自身。
并集
(other[, sort])形成两个索引对象的并集。
唯一
([level])返回索引中的唯一值。
value_counts
([normalize, sort, ascending, ...])返回一个包含唯一值计数的系列。
视图
([cls])返回具有指定 dtype 的 Index 视图或新的 Index 实例。
where
(cond[, other])在条件为假的地方替换值。