通用功能#

数据操作#

melt(frame[, id_vars, value_vars, var_name, ...])

将 DataFrame 从宽格式透视到长格式,可以选择保留标识符集。

pivot(data, *, columns[, index, values])

返回按给定索引/列值组织的重塑DataFrame。

pivot_table(data[, values, index, columns, ...])

创建一个电子表格样式的数据透视表作为 DataFrame。

crosstab(index, columns[, values, rownames, ...])

计算两个(或更多)因素的简单交叉表。

cut(x, bins[, right, labels, retbins, ...])

将值分箱到离散区间。

qcut(x, q[, labels, retbins, precision, ...])

基于分位数的离散化函数。

合并(左, 右[, 如何, 在, 左_在, ...])

使用数据库风格的连接合并 DataFrame 或命名 Series 对象。

merge_ordered(left, right[, on, left_on, ...])

对有序数据执行合并,可选择填充/插值。

merge_asof(left, right[, on, left_on, ...])

通过键距离执行合并。

concat(objs, *[, axis, join, ignore_index, ...])

沿特定轴连接 pandas 对象。

get_dummies(data[, prefix, prefix_sep, ...])

将分类变量转换为虚拟/指示变量。

from_dummies(data[, sep, default_category])

从虚拟变量的 DataFrame 创建一个分类的 DataFrame

factorize(values[, sort, use_na_sentinel, ...])

将对象编码为枚举类型或分类变量。

唯一(值)

基于哈希表返回唯一值。

lreshape(data, groups[, dropna])

将宽格式数据重塑为长格式。

wide_to_long(df, stubnames, i, j[, sep, suffix])

将 DataFrame 从宽格式透视到长格式。

顶级缺失数据#

isna(obj)

检测数组类对象的缺失值。

isnull(obj)

检测数组类对象的缺失值。

notna(obj)

检测数组类对象的非缺失值。

notnull(obj)

检测数组类对象的非缺失值。

处理数值数据的顶级内容#

to_numeric(arg[, errors, downcast, ...])

将参数转换为数值类型。

处理类似日期时间数据的顶级内容#

to_datetime(arg[, errors, dayfirst, ...])

将参数转换为日期时间。

to_timedelta(arg[, unit, errors])

将参数转换为 timedelta。

date_range([start, end, periods, freq, tz, ...])

返回一个固定频率的 DatetimeIndex。

bdate_range([开始, 结束, 周期, 频率, 时区, ...])

返回一个固定频率的 DatetimeIndex,默认以工作日为频率。

period_range([start, end, periods, freq, name])

返回一个固定频率的 PeriodIndex。

timedelta_range([start, end, periods, freq, ...])

返回一个固定频率的 TimedeltaIndex,默认以天为单位。

infer_freq(索引)

推断给定输入索引的最可能频率。

处理区间数据的顶级内容#

interval_range([start, end, periods, freq, ...])

返回一个固定频率的 IntervalIndex。

顶级评估#

eval(expr[, parser, engine, local_dict, ...])

使用各种后端评估作为字符串的Python表达式。

日期时间格式#

tseries.api.guess_datetime_format(dt_str[, ...])

猜测给定日期时间字符串的日期时间格式。

哈希#

util.hash_array(vals[, encoding, hash_key, ...])

给定一个一维数组,返回一个确定性整数数组。

util.hash_pandas_object(obj[,index,...])

返回 Index/Series/DataFrame 的数据哈希。

从其他 DataFrame 库导入#

api.interchange.from_dataframe(df[, allow_copy])

从任何支持交换协议的 DataFrame 构建一个 pd.DataFrame