字符串处理#
Series.str
可用于将 Series 的值作为字符串访问,并对其应用多种方法。这些方法可以通过 Series.str.<function/property>
访问。
用于 Series 和 Index 的矢量化字符串函数。 |
计算 Series/Index 中每个字符串的字节数。 |
|
将 Series/Index 中的字符串转换为首字母大写。 |
|
|
使用给定的分隔符连接 Series/Index 中的字符串。 |
|
在 Series/Index 中字符串的左侧和右侧填充额外字符。 |
|
从字符串列中的字符生成 n-gram。 |
每个字符串被分割成单个字符。 |
|
返回一个数组,其中填充了每个字符串中每个字符的 UTF-8 代码点值。 |
|
|
测试 Series 或 Index 的字符串中是否包含模式或正则表达式。 |
|
计算 Series/Index 中每个字符串中模式出现的次数。 |
|
通过按照 |
|
使用 Levenshtein 编辑距离算法,将 |
计算 Series 中字符串之间的编辑距离。 |
|
|
测试每个字符串元素的末尾是否与模式匹配。 |
|
将正则表达式 pat 中的捕获组提取为 DataFrame 中的列。 |
|
从此列中的字符串中移除非字母数字字符。 |
|
使用给定映射表中的字符范围从每个字符串中移除字符。 |
|
移除 Series 中每个字符串内小于 min_token_length 的标记,并可选地将其替换为替换字符串。 |
|
返回 Series/Index 中每个字符串中子字符串完全包含在 |
|
在 Series/Index 中查找模式或正则表达式的所有出现。 |
|
在 Series/Index 中查找模式的所有首次出现。 |
|
从每个组件中提取指定位置的元素。 |
|
将 JSONPath 字符串应用于输入字符串列,其中列中的每一行都是一个有效的 json 字符串。 |
返回每个十六进制字符串表示的整数值。 |
|
|
返回每个十六进制字符串表示的整数值。 |
|
返回每个字符串中子字符串完全包含在 |
|
在指定位置将指定字符串插入到每个字符串中。 |
|
这会将 ip 字符串转换为整数。 |
这会将 ip 字符串转换为整数。 |
|
|
对于 |
|
对于 |
|
检查每个字符串中的所有字符是否都是字母数字。 |
|
检查每个字符串中的所有字符是否都是字母。 |
检查每个字符串中的所有字符是否都是十进制数字。 |
|
|
检查每个字符串中的所有字符是否都是数字。 |
|
检查每个字符串是否为空字符串。 |
|
检查每个字符串中的所有字符是否构成浮点值。 |
|
检查每个字符串中的所有字符是否构成十六进制整数。 |
检查每个字符串中的所有字符是否构成整数。 |
|
|
检查每个字符串中的所有字符是否构成 IPv4 地址。 |
|
检查每个字符串中的所有字符是否都是空白字符。 |
|
检查每个字符串中的所有字符是否都是小写。 |
检查每个字符串中的所有字符是否都是数字。 |
|
|
检查每个字符串中的所有字符是否都是大写。 |
|
检查每个字符串中的所有字符是否可以使用给定格式转换为时间戳。 |
|
检查每个字符串是否为标题格式。 |
|
计算此列与给定输入字符串列之间的 Jaccard 索引。 |
|
使用传入的分隔符连接 Series/Index 中作为元素的列表。 |
|
计算 Series/Index 中每个元素的长度。 |
|
测试 like 模式是否匹配 Series 或 Index 的字符串。 |
|
在 Series/Index 中字符串的右侧填充额外字符。 |
|
将所有字符转换为小写。 |
|
移除开头和结尾字符。 |
|
确定每个字符串是否匹配正则表达式。 |
|
计算字符串列或术语列表字符串列的 minhash。 |
|
从一组标记生成 n-gram,Series 中的每条记录都被视为一个标记。 |
|
使用每个字符串中的标记生成 n-gram。 |
|
规范化字符串字符以进行标记化。 |
移除标记之间的额外空白,并修剪每个字符串开头和结尾的空白。 |
|
|
将 Series/Index 中的字符串填充到指定宽度。 |
|
在 sep 的第一次出现处分割字符串。 |
计算每个字符串的 Porter Stemmer 度量。 |
|
|
复制 Series 或 Index 中的每个字符串。 |
|
从对象 Series 中移除前缀。 |
|
从对象 Series 中移除后缀。 |
|
将 Series/Index 中模式/正则表达式的出现替换为其他字符串。 |
|
在 Series 的每个字符串中搜索 targets 标记,如果找到则替换为相应的 replacements。 |
|
使用 |
|
返回 Series/Index 中每个字符串中子字符串完全包含在 |
|
返回每个字符串中子字符串完全包含在 |
|
在 Series/Index 中字符串的左侧填充额外字符。 |
|
在 sep 的最后一次出现处分割字符串。 |
|
在给定分隔符周围分割字符串。 |
|
移除开头和结尾字符。 |
|
从 Series 或 Index 中的每个元素切片子字符串。 |
|
使用每个字符串的位置返回每个字符串的子字符串。 |
|
用新字符串替换每个字符串的指定部分。 |
|
在给定分隔符周围分割字符串。 |
|
测试每个字符串元素的开头是否与模式匹配。 |
|
移除开头和结尾字符。 |
|
将每个小写字符更改为大写,反之亦然。 |
|
将空格后每个字母的第一个字母大写,其余小写。 |
|
使用提供的定界符将每个字符串分割成标记。 |
|
使用提供的定界符将每个字符串分割成标记。 |
|
通过给定的映射表映射字符串中的所有字符。 |
|
将每个字符串转换为大写。 |
返回每个字符串的 URL 解码格式。 |
|
返回每个字符串的 URL 编码格式。 |
|
|
将 Series/Index 中的长字符串换行,使其格式化为段落,长度小于给定宽度。 |
|
通过在 Series/Index 中的字符串前面加上 '0' 字符来填充字符串。 |