Series#
构造函数#
|
一维 GPU 数组(包括时间序列)。 |
属性#
轴
返回表示 Series 轴的列表。 |
|
获取行的标签。 |
|
返回 DataFrame 的 CuPy 表示形式。 |
|
数据对应的 GPU 缓冲区 |
|
Series 的 dtype。 |
|
Series 的 dtype。 |
|
获取表示 Index 维度的元组。 |
|
底层数据的维度数,定义上为 1。 |
|
指示是否需要空值掩码的布尔值 |
|
空值掩码对应的 GPU 缓冲区 |
|
空值数量 |
|
返回底层数据中的元素数量。 |
|
返回转置,根据定义即为自身。 |
|
|
返回对象的内存使用情况。 |
如果存在任何 NaNs 或空值,则返回 True。 |
|
指示 Series 是否包含空值。 |
|
指示 DataFrame 或 Series 是否为空。 |
|
获取此对象的名称。 |
|
非空值数量 |
|
返回数据的 NumPy 表示形式。 |
转换#
|
将对象转换为给定的 dtype。 |
|
将列转换为最佳的可空 dtype。 |
|
创建此对象的索引和数据的副本。 |
|
从序列化表示生成对象。 |
|
执行设备端反序列化任务。 |
序列化与设备内存相关的数据和元数据。 |
|
|
执行设备端反序列化任务。 |
序列化与主机内存相关的数据和元数据。 |
|
生成对象的等效可序列化表示形式。 |
|
当前不支持转换为主机内存列表 |
|
当前不支持转换为主机内存列表 |
|
|
|
将值按 float64 缩放到 [0, 1] |
索引、迭代#
按标签或布尔掩码选择行和列。 |
|
按位置选择值。 |
|
不支持迭代。 |
|
不支持迭代。 |
|
不支持迭代。 |
|
返回 index 的别名。 |
|
|
将一维轴对象压缩为标量。 |
二元运算符函数#
|
获取 DataFrame 或 Series 与 other 的逐元素相加(二元运算符 add)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相减(二元运算符 sub)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相减(二元运算符 sub)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相乘(二元运算符 mul)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素相乘(二元运算符 mul)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点除法(二元运算符 truediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点除法(二元运算符 truediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素浮点除法(二元运算符 truediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素整数除法(二元运算符 floordiv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素取模(二元运算符 mod)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素指数(二元运算符 pow)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向相加(二元运算符 radd)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向相减(二元运算符 rsub)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向相乘(二元运算符 rmul)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向浮点除法(二元运算符 rtruediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向浮点除法(二元运算符 rtruediv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向整数除法(二元运算符 rfloordiv)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向取模(二元运算符 rmod)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素反向指数(二元运算符 rpow)。 |
|
四舍五入到可变的小数位数。 |
|
获取 DataFrame 或 Series 与 other 的逐元素小于比较(二元运算符 lt)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素大于比较(二元运算符 gt)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素小于等于比较(二元运算符 le)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素大于等于比较(二元运算符 ge)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素不等于比较(二元运算符 ne)。 |
|
获取 DataFrame 或 Series 与 other 的逐元素等于比较(二元运算符 eq)。 |
|
返回 DataFrame 中值的乘积。 |
|
获取 frame 与 other 的点积(二元运算符 dot)。 |
函数应用、GroupBy 和 window#
|
对 Series 的值应用标量函数。 |
|
根据输入的对应关系映射 Series 的值。 |
|
使用映射器或按列的 Series 进行分组。 |
|
滑动窗口计算。 |
|
应用 |
计算 / 描述性统计#
返回一个 Series/DataFrame,其中包含每个元素的绝对数值。 |
|
|
返回 DataFrame 中所有元素是否都为 True。 |
|
返回 DataFrame 中是否有任何元素为 True。 |
|
计算滞后 N 的自相关。 |
|
返回等同于 left <= series <= right 的布尔 Series。 |
|
根据输入阈值裁剪值。 |
|
计算两个 Series 之间的样本相关性,不包括缺失值。 |
返回 Series 中非 NA/null 观测值的数量 |
|
|
计算与 Series 的协方差,不包括缺失值。 |
|
返回 Series 的累积最大值。 |
|
返回 Series 的累积最小值。 |
|
返回 Series 的累积乘积。 |
|
返回 Series 的累积和。 |
|
生成描述性统计信息。 |
|
元素的首次离散差。 |
|
返回每个值所属 bin 的索引。 |
|
提供指数加权 (EW) 函数。 |
|
将输入值编码为整数标签。 |
|
返回样本的 Fisher 无偏峰度。 |
|
返回 DataFrame 中值的最大值。 |
|
返回请求轴的值的平均值。 |
|
返回请求轴的值的中位数。 |
|
返回 DataFrame 中值的最小值。 |
|
返回数据集的众数。 |
|
返回一个包含 n 个最大元素的新 Series。 |
|
返回一个包含 n 个最小元素的新 Series。 |
|
计算 Series 中连续元素之间的百分比变化。 |
|
返回 DataFrame 中值的乘积。 |
|
返回给定分位数的值。 |
|
沿轴计算数值数据的排名(1 到 n)。 |
|
返回样本的无偏 Fisher-Pearson 偏度。 |
|
返回 DataFrame 的样本标准差。 |
|
返回 DataFrame 中值的总和。 |
|
返回 DataFrame 的无偏方差。 |
|
返回样本的 Fisher 无偏峰度。 |
返回此 Series 的唯一值。 |
|
|
返回列中唯一值的数量。 |
如果对象中的值是唯一的,则返回布尔值。 |
|
如果对象中的值是单调递增的,则返回布尔值。 |
|
如果对象中的值是单调递减的,则返回布尔值。 |
|
|
返回包含唯一值计数的 Series。 |
重索引 / 选择 / 标签操作#
|
使用字符串 prefix 给标签添加前缀。 |
|
使用字符串 suffix 给标签添加后缀。 |
|
从行或列中删除指定的标签。 |
|
返回移除重复值后的 Series。 |
|
指示重复的 Series 值。 |
|
测试两个对象是否包含相同的元素。 |
|
根据日期偏移量选择时间序列数据的初始周期。 |
|
返回前 n 行。 |
|
检查值是否包含在 Series 中。 |
|
根据日期偏移量选择时间序列数据的最终周期。 |
|
使 Series 符合新索引。 |
|
修改 Series 名称 |
|
重置 Series 的索引,或其中一个级别。 |
|
从对象的一个轴中返回随机抽样的项。 |
|
返回一个包含由 indices 指定的行的新 Frame。 |
|
以新的 DataFrame 或 Series 形式返回最后 n 行。 |
|
将行重复 count 次以形成一个新的 Frame。 |
|
在某个索引值之前和之后截断 Series 或 DataFrame。 |
|
在条件为 False 的地方替换值。 |
|
在条件为 True 的地方替换值。 |
缺失数据处理#
|
是 |
|
是 |
|
返回一个移除 null 值的 Series。 |
|
是 |
|
用 |
|
在某些点之间插值数据值。 |
识别缺失值。 |
|
识别缺失值。 |
|
将 nan 值(如果存在)转换为 null 值。 |
|
识别非缺失值。 |
|
识别非缺失值。 |
|
|
是 |
|
用 |
重塑、排序#
|
返回对 Series 值进行排序的整数索引。 |
|
沿任一轴按值排序。 |
|
按标签(沿轴)排序对象。 |
|
将类列表的每个元素转换为行,并复制索引值。 |
|
查找应插入元素以保持顺序的索引。 |
|
连续重复元素。 |
返回转置,根据定义即为自身。 |
组合 / 比较 / 连接 / 合并#
|
使用传入 Series 中的值就地修改 Series。 |
访问器#
pandas 在各种访问器下提供了特定于 dtype 的方法。这些是 Series
中仅适用于特定数据类型的独立命名空间。
日期时间类属性#
Series.dt
可用于将 Series 的值作为日期时间类访问,并返回几个属性。可以通过 Series.dt.<function/property>
的方式访问这些属性。
Series 值的日期时间类属性的访问器对象。 |
日期时间属性#
日期时间的年份。 |
|
月份,1 表示一月,12 表示十二月。 |
|
日期时间的日期。 |
|
日期时间的小时。 |
|
日期时间的分钟。 |
|
日期时间的秒。 |
|
日期时间的微秒。 |
|
日期时间的纳秒。 |
|
星期几,0 表示周一,6 表示周日。 |
|
星期几,0 表示周一,6 表示周日。 |
|
一年中的第几天,非闰年为 1-365,闰年为 1-366。 |
|
一年中的第几天,非闰年为 1-365,闰年为 1-366。 |
|
指示日期属于一年中哪个季度的整数。 |
|
布尔值,指示日期是否是月份的第一天。 |
|
布尔值指示日期是否是月份的最后一天。 |
|
布尔值指示日期是否是季度的第一天。 |
|
布尔值指示日期是否是季度的最后一天。 |
|
布尔值指示日期是否是一年的第一天。 |
|
布尔值指示日期是否是一年的最后一天。 |
|
布尔值指示日期是否属于闰年。 |
|
获取日期所在月份的总天数。 |
日期时间方法#
返回一个 DataFrame,其中包含根据 ISO 8601 标准计算的年、周和日。 |
|
|
使用指定的 |
|
对数据执行指定 freq 的 round 操作。 |
|
对数据执行指定 freq 的 floor 操作。 |
|
对数据执行指定 freq 的 ceil 操作。 |
|
将时区不敏感的数据本地化为时区敏感的数据。 |
时间差属性#
字符串处理#
Series.str
可用于将 Series 的值作为字符串访问,并对其应用多种方法。可以通过 Series.str.<function/property>
的方式访问这些方法。
Series 和 Index 的向量化字符串函数。 |
|
计算 Series/Index 中每个字符串的字节数。 |
|
将 Series/Index 中的字符串转换为首字母大写。 |
|
使用给定的分隔符连接 Series/Index 中的字符串。 |
|
使用附加字符填充 Series/Index 中字符串的左侧和右侧。 |
|
从字符串列中的字符生成 n-gram。 |
|
每个字符串被分割成单个字符。 |
|
返回一个数组,其中填充了每个字符串中每个字符的 UTF-8 码点值。 |
|
测试 Series 或 Index 的字符串中是否包含模式或正则表达式。 |
|
计算 Series/Index 中每个字符串中模式的出现次数。 |
|
通过按照令牌在 |
|
使用 Levenshtein 编辑距离算法测量 |
|
计算 Series 中字符串之间的编辑距离。 |
|
测试每个字符串元素的结尾是否匹配模式。 |
|
将正则表达式 pat 中的捕获组提取为 DataFrame 中的列。 |
|
从此列中的字符串中移除非字母数字字符。 |
|
使用给定映射表中的字符范围从每个字符串中移除字符。 |
|
从 Series 的每个字符串中移除小于 min_token_length 的令牌,并可选择将其替换为替换字符串。 |
|
返回 Series/Index 中每个字符串中子字符串完全包含在 |
|
在 Series/Index 中查找模式或正则表达式的所有出现。 |
|
在 Series/Index 中查找模式的所有首次出现。 |
|
从指定位置的每个组件中提取元素。 |
|
将 JSONPath 字符串应用于输入字符串列,其中列中的每一行都是有效的 json 字符串。 |
返回每个十六进制字符串表示的整数值。 |
|
|
返回每个十六进制字符串表示的整数值。 |
|
返回每个字符串中子字符串完全包含在 |
|
在指定位置将指定字符串插入到每个字符串中。 |
|
这将 IP 字符串转换为整数。 |
这将 IP 字符串转换为整数。 |
|
|
对于 |
|
对于 |
|
检查每个字符串中的所有字符是否都是字母数字。 |
|
检查每个字符串中的所有字符是否都是字母。 |
检查每个字符串中的所有字符是否都是十进制数字。 |
|
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串是否是空字符串。 |
|
检查每个字符串中的所有字符是否形成浮点值。 |
|
检查每个字符串中的所有字符是否形成十六进制整数。 |
检查每个字符串中的所有字符是否形成整数。 |
|
|
检查每个字符串中的所有字符是否形成 IPv4 地址。 |
|
检查每个字符串中的所有字符是否都是空白字符。 |
|
检查每个字符串中的所有字符是否都是小写。 |
检查每个字符串中的所有字符是否都是数字。 |
|
|
检查每个字符串中的所有字符是否都是大写。 |
|
检查每个字符串中的所有字符是否可以使用给定格式转换为时间戳。 |
|
检查每个字符串是否是标题格式。 |
|
计算此列与给定输入字符串列之间的 Jaccard 指数。 |
|
使用传递的分隔符连接 Series/Index 中作为元素包含的列表。 |
|
计算 Series/Index 中每个元素的长度。 |
|
测试 like 模式是否匹配 Series 或 Index 的字符串。 |
|
使用附加字符填充 Series/Index 中字符串的右侧。 |
|
将所有字符转换为小写。 |
|
移除开头和结尾字符。 |
|
确定每个字符串是否匹配正则表达式。 |
|
计算字符串列或由术语组成的列表字符串列的 minhash。 |
|
从一组令牌生成 n-gram,Series 中的每个记录被视为一个令牌。 |
|
使用每个字符串中的令牌生成 n-gram。 |
|
规范化字符串字符以进行分词。 |
|
移除令牌之间的多余空格,并修剪每个字符串开头和结尾的空格。 |
|
将 Series/Index 中的字符串填充到指定宽度。 |
|
在 sep 的第一次出现时分割字符串。 |
计算每个字符串的 Porter Stemmer 度量。 |
|
|
复制 Series 或 Index 中的每个字符串。 |
|
从对象 Series 中移除前缀。 |
|
从对象 Series 中移除后缀。 |
|
用其他字符串替换 Series/Index 中模式/正则表达式的出现。 |
|
在 Series 的每个字符串中搜索目标令牌,如果找到,则替换为相应的替换项。 |
|
使用 |
|
返回 Series/Index 中每个字符串中子字符串完全包含在 |
|
返回每个字符串中子字符串完全包含在 |
|
使用附加字符填充 Series/Index 中字符串的左侧。 |
|
在 sep 的最后一次出现时分割字符串。 |
|
根据给定的分隔符分割字符串。 |
|
移除开头和结尾字符。 |
|
从 Series 或 Index 中的每个元素切片子字符串。 |
|
使用每个字符串的位置返回每个字符串的子字符串。 |
|
将每个字符串的指定部分替换为新字符串。 |
|
根据给定的分隔符分割字符串。 |
|
测试每个字符串元素的开头是否匹配模式。 |
|
移除开头和结尾字符。 |
|
将每个小写字符转换为大写,反之亦然。 |
|
将每个单词(空格后的第一个字母)的首字母大写,其余字母小写。 |
|
使用提供的分隔符将每个字符串分割成令牌。 |
|
使用提供的分隔符将每个字符串分割成令牌。 |
|
通过给定的映射表映射字符串中的所有字符。 |
|
将每个字符串转换为大写。 |
返回每个字符串的 URL 解码格式。 |
|
返回每个字符串的 URL 编码格式。 |
|
|
将 Series/Index 中的长字符串进行换行,使其格式化为长度小于给定宽度的段落。 |
|
通过在 Series/Index 中的字符串前面添加 '0' 字符进行填充。 |
分类访问器#
特定于分类 dtype 的方法和属性可在 Series.cat
访问器下使用。
Series 值的分类属性的访问器对象。 |
此分类的类别。 |
|
类别是否具有有序关系。 |
|
返回编码 Series 以及索引。 |
|
|
按 new_categories 中指定的顺序重新排序类别。 |
|
添加新类别。 |
|
移除指定的类别。 |
|
将类别设置为指定的新类别。 |
|
将 Categorical 设置为有序。 |
|
将 Categorical 设置为无序。 |
列表处理#
Series.list
可用于将 Series 的值作为列表访问,并对其应用列表方法。可以通过 Series.list.<function/property>
的方式访问这些方法。
Series 的列表方法。 |
|
返回一个新的列表 Series,其中叶子值被转换为指定的数据类型。 |
|
对于至少嵌套一层级的列,连接每行中的列表。 |
|
返回布尔值,指示指定的标量是否是每行的元素。 |
|
返回表示每行搜索键索引的整数。 |
|
从列表 Series 中的每个列表中提取给定索引处的元素。 |
从(可能嵌套的)列表 Series 中,将最内层列表的元素作为平面 Series(每行一个值)获取。 |
|
|
计算 Series/Index 中每个元素的长度。 |
|
按值对每个列表进行排序。 |
|
根据给定索引收集列表元素。 |
|
返回每个列表中的唯一元素。 |
结构体处理#
Series.struct
可用于将 Series 的值作为 Struct 访问,并对其应用 Struct 方法。可以通过 Series.struct.<function/property>
的方式访问这些方法。
Series 的 Struct 方法。 |
序列化 / IO / 转换#
转换为 PyArrow Array。 |
|
|
将 Frame 转换为 CuPy 数组。 |
|
将 Series 转换为 {标签 -> 值} 字典或类似字典的对象。 |
将 cuDF 对象转换为 DLPack 张量。 |
|
|
将 Series 转换为 DataFrame。 |
|
使用 HDFStore 将包含的数据写入 HDF5 文件。 |
|
将 cuDF 对象转换为 JSON 字符串。 |
|
将 Frame 转换为 NumPy 数组。 |
|
转换为 pandas Series。 |
转换为字符串。 |
|
|
从 PyArrow Array/ChunkedArray 创建。 |
|
从 pandas.Categorical 创建。 |
|
创建一个带有 null 掩码的 Series。 |
|
从 Pandas Series 转换。 |
|
计算此列中值的哈希值。 |
|
将此 Series 转换为 pylibcudf.Column。 |
|
从 pylibcudf.Column 创建 Series。 |