DataFrame#
构造函数#
|
二维、可变大小、潜在异构的表格数据。 |
属性和底层数据#
Axes
DataFrame 的索引(行标签)。 |
|
DataFrame 的列标签。 |
返回DataFrame中的数据类型。 |
|
|
打印一个DataFrame的简要摘要。 |
|
根据列数据类型返回DataFrame列的子集。 |
返回 DataFrame 的 Numpy 表示形式。 |
|
返回一个表示 DataFrame 轴的列表。 |
|
返回一个表示轴数 / 数组维数的整数。 |
|
返回一个表示此对象中元素数量的整数。 |
|
返回一个表示 DataFrame 维度的元组。 |
|
|
返回每个列的内存使用情况,以字节为单位。 |
指示 Series/DataFrame 是否为空。 |
|
|
返回一个带有更新标志的新对象。 |
转换#
|
将 pandas 对象转换为指定的数据类型 |
|
将列从 numpy dtypes 转换为支持 |
|
尝试为对象列推断更好的数据类型。 |
|
复制此对象的索引和数据。 |
|
将 DataFrame 转换为 NumPy 数组。 |
索引,迭代#
|
返回前 n 行。 |
访问行/列标签对的一个单一值。 |
|
通过整数位置访问行/列对的单个值。 |
|
通过标签或布尔数组访问一组行和列。 |
|
纯基于整数位置的索引,用于按位置选择。 |
|
|
在指定位置将列插入到 DataFrame 中。 |
遍历信息轴。 |
|
遍历 (列名, 系列) 对。 |
|
获取 '信息轴'(更多信息请参见索引)。 |
|
遍历 DataFrame 行作为 (索引, Series) 对。 |
|
|
迭代 DataFrame 行作为命名元组。 |
|
返回项目并从 DataFrame 中删除它。 |
|
返回最后 n 行。 |
|
从 Series/DataFrame 返回横截面。 |
|
从对象中获取给定键的项(例如:DataFrame 列)。 |
|
DataFrame 中的每个元素是否包含在值中。 |
|
在条件为假的地方替换值。 |
|
在条件为真时替换值。 |
|
使用布尔表达式查询DataFrame的列。 |
|
在位置为 loc 的列中设置给定值。 |
有关 .at
, .iat
, .loc
, 和 .iloc
的更多信息,请参阅 索引文档。
二元运算符函数#
|
获取 DataFrame 和其他数据框的列式相加结果。 |
|
获取数据框和其他对象的逐元素相加结果(二元运算符 add)。 |
|
获取数据框和其他对象之间的逐元素减法(二元运算符 sub)。 |
|
获取数据框和其他元素的乘积,逐元素操作(二元运算符 mul)。 |
|
获取数据框和其他元素的浮点除法(二元运算符 truediv)。 |
|
获取数据框和其他元素的浮点除法(二元运算符 truediv)。 |
|
获取数据框和其他对象的整数除法,逐元素操作(二元运算符 floordiv)。 |
|
获取数据框和其他对象的元素级模运算(二元运算符 mod)。 |
|
获取数据框和其他元素的指数幂(二元运算符 pow)。 |
|
计算 DataFrame 和其他之间的矩阵乘法。 |
|
获取数据框和其他对象的逐元素相加结果(二元运算符 radd)。 |
|
获取数据框和其他对象之间的元素减法(二元运算符 rsub)。 |
|
获取数据框和其他元素的乘积,逐元素操作(二元运算符 rmul)。 |
|
获取数据框和其他对象的浮点除法,逐元素操作(二元运算符 rtruediv)。 |
|
获取数据框和其他对象的浮点除法,逐元素操作(二元运算符 rtruediv)。 |
|
获取数据框和其他对象的整数除法,逐元素操作(二元运算符 rfloordiv)。 |
|
获取数据框和其他对象的模数,逐元素(二元运算符 rmod)。 |
|
获取数据框和其他元素的指数幂(二元运算符 rpow)。 |
|
Get Greater than of dataframe and other, element-wise (binary operator lt). |
|
获取数据框和其他元素之间的更大值,逐元素比较(二元运算符 gt)。 |
|
Get Greater than or equal to of dataframe and other, element-wise (binary operator le). |
|
获取数据框和其他元素的“大于或等于”结果,逐元素操作(二元运算符 ge)。 |
|
获取数据框和另一个数据框的元素不等(二元运算符 ne)。 |
|
Get Not equal to of dataframe and other, element-wise (binary operator eq). |
|
与另一个 DataFrame 进行列合并。 |
|
使用 other 中相同位置的值更新空元素。 |
函数应用, GroupBy 与 窗口#
|
沿 DataFrame 的轴应用函数。 |
|
对 Dataframe 的每个元素应用一个函数。 |
|
应用期望 Series 或 DataFrames 的可链接函数。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
在指定轴上使用一个或多个操作进行聚合。 |
|
在自身上调用 |
|
使用映射器或按列的Series对DataFrame进行分组。 |
|
提供滚动窗口计算。 |
|
提供扩展窗口计算。 |
|
提供指数加权(EW)计算。 |
计算 / 描述性统计#
返回一个包含每个元素绝对数值的 Series/DataFrame。 |
|
|
返回是否所有元素都是 True,可能是在某个轴上。 |
|
返回是否任何元素为 True,可能超过一个轴。 |
|
在输入阈值处修剪值。 |
|
计算列之间的成对相关性,排除NA/null值。 |
|
计算成对相关性。 |
|
计算每列或每行的非NA单元格数量。 |
|
计算列之间的成对协方差,排除NA/null值。 |
|
返回 DataFrame 或 Series 轴上的累积最大值。 |
|
返回 DataFrame 或 Series 轴上的累积最小值。 |
|
返回 DataFrame 或 Series 轴上的累积乘积。 |
|
返回 DataFrame 或 Series 轴上的累积和。 |
|
生成描述性统计数据。 |
|
元素的第一个离散差分。 |
|
评估一个描述对 DataFrame 列进行操作的字符串。 |
|
返回请求轴上的无偏峰度。 |
|
返回请求轴上的无偏峰度。 |
|
返回请求轴上的最大值。 |
|
返回请求轴上值的平均值。 |
|
返回请求轴上值的中位数。 |
|
返回请求轴上值的最小值。 |
|
获取沿选定轴的每个元素的模式。 |
|
当前元素与先前元素之间的分数变化。 |
|
返回所请求轴上值的乘积。 |
|
返回所请求轴上值的乘积。 |
|
返回在请求轴上的给定分位数的返回值。 |
|
沿轴计算数值数据的排名(从1到n)。 |
|
将 DataFrame 四舍五入到可变的小数位数。 |
|
返回请求轴上的无偏均值标准误差。 |
|
返回请求轴上的无偏斜度。 |
|
返回所请求轴上值的总和。 |
|
返回请求轴上的样本标准偏差。 |
|
返回请求轴上的无偏方差。 |
|
计算指定轴中不同元素的数量。 |
|
返回一个包含 DataFrame 中每行不同频率的 Series。 |
重新索引 / 选择 / 标签操作#
|
使用字符串 prefix 作为标签前缀。 |
|
使用字符串 suffix 作为后缀标签。 |
|
使用指定的连接方法将两个对象沿其轴对齐。 |
|
在特定时间选择值(例如,上午9:30)。 |
|
选择一天中特定时间段的值(例如,上午9:00-9:30)。 |
|
从行或列中删除指定的标签。 |
|
返回删除了重复行的 DataFrame。 |
|
返回表示重复行的布尔序列。 |
|
测试两个对象是否包含相同的元素。 |
|
根据指定的索引标签对 DataFrame 或 Series 进行子集化。 |
|
返回前 n 行。 |
|
返回请求轴上最大值的第一个出现的索引。 |
|
返回请求轴上最小值的第一个出现的索引。 |
|
使 DataFrame 符合新的索引,并带有可选的填充逻辑。 |
|
返回一个对象,其索引与其他对象匹配。 |
|
重命名列或索引标签。 |
|
设置索引或列的轴名称。 |
|
重置索引,或其某个级别。 |
|
从对象的轴返回一个随机样本项。 |
|
将所需的索引分配给给定的轴。 |
|
使用现有列设置 DataFrame 索引。 |
|
返回最后 n 行。 |
|
返回沿指定轴的给定 位置 索引中的元素。 |
|
在某个索引值之前和之后截断一个 Series 或 DataFrame。 |
缺失数据处理#
|
使用下一个有效观测值来填充 NA/NaN 值。 |
|
移除缺失值。 |
|
用最后一个有效观测值填充 NA/NaN 值以传播到下一个有效值。 |
|
用 value 填充 NA/NaN 值。 |
|
使用插值方法填充NaN值。 |
检测缺失值。 |
|
DataFrame.isnull 是 DataFrame.isna 的别名。 |
|
检测现有的(非缺失的)值。 |
|
DataFrame.notnull 是 DataFrame.notna 的别名。 |
|
|
将 to_replace 中的值替换为 value。 |
重塑、排序、转置#
|
返回删除了请求的索引/列级别的 Series/DataFrame。 |
|
返回按给定索引/列值组织的重塑DataFrame。 |
|
创建一个电子表格样式的数据透视表作为 DataFrame。 |
|
使用输入 |
|
按任一轴的值排序。 |
|
按标签排序对象(沿轴)。 |
|
返回按 columns 降序排列的前 n 行。 |
|
返回按 columns 升序排列的前 n 行。 |
|
在 |
|
将规定的级别从列堆叠到索引。 |
|
旋转(必须是层次结构的)索引标签的一个层级。 |
|
将DataFrame从宽格式透视为长格式,可选择保留标识符集。 |
|
将类似列表的每个元素转换为一行,复制索引值。 |
|
将一维轴对象压缩为标量。 |
从 pandas 对象返回一个 xarray 对象。 |
|
DataFrame 的转置。 |
|
|
转置索引和列。 |
结合 / 比较 / 连接 / 合并#
|
将新列分配给 DataFrame。 |
|
与另一个 DataFrame 进行比较并显示差异。 |
|
连接另一个DataFrame的列。 |
|
使用数据库风格的连接合并 DataFrame 或命名 Series 对象。 |
|
使用另一个DataFrame中的非NA值就地修改。 |
Flags#
标志指的是 pandas 对象的属性。数据集的属性(如记录日期、访问来源的 URL 等)应存储在 DataFrame.attrs
中。
|
适用于 pandas 对象的标志。 |
元数据#
DataFrame.attrs
是一个用于存储此 DataFrame 的全局元数据的字典。
警告
DataFrame.attrs
被认为是实验性的,可能会在没有警告的情况下发生变化。
此数据集的全局属性字典。 |
绘图#
DataFrame.plot
既是一个可调用的方法,也是一个特定绘图方法的命名空间属性,形式为 DataFrame.plot.<kind>
。
|
DataFrame 绘图访问器和方法 |
|
绘制一个堆积面积图。 |
|
垂直条形图。 |
|
制作一个水平条形图。 |
|
绘制 DataFrame 列的箱形图。 |
|
使用高斯核生成核密度估计图。 |
|
生成一个六边形分箱图。 |
|
绘制 DataFrame 列的一个直方图。 |
|
使用高斯核生成核密度估计图。 |
|
将 Series 或 DataFrame 绘制为线条。 |
|
生成一个饼图。 |
|
创建一个散点图,使用不同的标记点大小和颜色。 |
|
从 DataFrame 列中生成箱形图。 |
|
绘制 DataFrame 列的直方图。 |
稀疏访问器#
在 DataFrame.sparse
访问器下提供了稀疏数据类型特定的方法和属性。
非稀疏点到总(密集)数据点的比例。 |
|
从 scipy 稀疏矩阵创建一个新的 DataFrame。 |
将帧的内容作为稀疏的 SciPy COO 矩阵返回。 |
|
将包含稀疏值的 DataFrame 转换为密集型。 |
序列化 / IO / 转换#
|
从数组类或字典的字典构造 DataFrame。 |
|
将结构化或记录 ndarray 转换为 DataFrame。 |
|
将一个 DataFrame 写入优化行列(ORC)格式。 |
|
将一个 DataFrame 写入二进制 parquet 格式。 |
|
将对象序列化(pickle)到文件中。 |
|
将对象写入逗号分隔值(csv)文件。 |
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将存储在 DataFrame 中的记录写入 SQL 数据库。 |
|
将 DataFrame 转换为字典。 |
|
将对象写入 Excel 表格。 |
|
将对象转换为 JSON 字符串。 |
|
将 DataFrame 渲染为 HTML 表格。 |
|
将 DataFrame 写入二进制 Feather 格式。 |
|
将对象渲染为 LaTeX 表格、长表格或嵌套表格。 |
|
将 DataFrame 对象导出为 Stata dta 格式。 |
|
将 DataFrame 转换为 NumPy 记录数组。 |
|
将 DataFrame 渲染为控制台友好的表格输出。 |
|
将对象复制到系统剪贴板。 |
|
以Markdown友好格式打印DataFrame。 |
返回一个 Styler 对象。 |
|
|
返回实现交换协议的数据帧交换对象。 |