跳到主要内容
Ctrl+K
cudf 25.04.00 documentation - Home cudf 25.04.00 documentation - Home
  • cuDF 用户指南
  • cudf.pandas
  • Polars GPU 引擎
  • pylibcudf 文档
  • libcudf 文档
    • 开发者指南
  • GitHub
  • Twitter
主页
cudf
cucimcudf-javacudfcugraphcumlcuprojcuspatialcuvscuxfilterdask-cudadask-cudfkvikiolibcudflibcumllibcuprojlibcuspatiallibkvikiolibrmmlibucxxraftrapids-cmakerapidsmpfrmm
稳定版 (25.04)
每夜构建版 (25.06)稳定版 (25.04)旧版 (25.02)
  • cuDF 用户指南
  • cudf.pandas
  • Polars GPU 引擎
  • pylibcudf 文档
  • libcudf 文档
  • 开发者指南
  • GitHub
  • Twitter

章节导航

目录

  • libcudf 文档
    • libcudf
    • 默认流
    • 内存资源管理
    • Cudf 类
      • 列类
        • 列工厂
        • 字典类
        • 列表类
        • 字符串类
        • 结构体类
        • 时间戳类
      • 表类
      • 标量类
        • 标量工厂
      • 定点数类
    • 列 API
      • 列复制
        • 复制拼接
        • 复制收集
        • 复制散布
        • 复制切片
        • 复制分割
        • 复制位移
      • 列空值掩码
      • 列排序
      • 列搜索
      • 列哈希
      • 列合并
      • 列连接
      • 列分位数
      • 列聚合
        • 聚合工厂
        • 聚合规约
        • 聚合分组
        • 聚合滚动
      • 列转换
        • 转换一元运算
        • 转换二元运算
        • 转换变换
        • 转换替换
        • 转换填充
      • 列重塑
        • 重塑转置
      • 列重排
        • 重排分区
        • 重排紧凑
      • 列互操作
        • 互操作 Dlpack
        • 互操作 Arrow
    • 日期时间 API
      • 日期时间提取
      • 日期时间计算
    • 字符串 API
      • 字符串大小写
      • 字符串类型
      • 字符串组合
      • 字符串包含
      • 字符串转换
      • 字符串复制
      • 字符串切片
      • 字符串查找
      • 字符串修改
      • 字符串替换
      • 字符串分割
      • 字符串提取
      • 字符串正则
    • 字典 API
      • 字典编码
      • 字典搜索
      • 字典更新
    • Io API
      • Io 类型
      • Io 读取器
      • Io 写入器
      • Io 数据源
      • Io 数据汇
    • JSON API
      • JSON 对象
    • 列表 API
      • 列表组合
      • 列表修改
      • 列表提取
      • 列表填充
      • 列表包含
      • 列表收集
      • 列表元素
      • 列表过滤
      • 列表排序
      • 集合操作
    • Nvtext API
      • Nvtext Ngrams
      • Nvtext 规范化
      • Nvtext 词干提取
      • Nvtext 编辑距离
      • Nvtext 分词
      • Nvtext 替换
      • Nvtext Minhash
      • Nvtext Jaccard
    • 工具 API
      • 工具类型
      • 工具调度器
      • 工具位掩码
      • 工具错误
      • 工具 Span
    • 标记 API
      • 标记分箱
    • 表达式求值
    • tdigest
  • 正则表达式特性
  • Unicode 限制
  • libcudf 文档
  • libcudf 文档
  • Nvtext API

Nvtext API#

组 NVText

目录

  • Nvtext Ngrams
    • generate_ngrams()
    • generate_character_ngrams()
    • hash_character_ngrams()
    • ngrams_tokenize()
  • Nvtext 规范化
    • normalize_spaces()
    • normalize_characters()
    • create_character_normalizer()
    • normalize_characters()
    • nvtext::character_normalizer
  • Nvtext 词干提取
    • letter_type
    • is_letter()
    • is_letter()
    • porter_stemmer_measure()
  • Nvtext 编辑距离
    • edit_distance()
    • edit_distance_matrix()
  • Nvtext 分词
    • load_merge_pairs()
    • byte_pair_encoding()
    • load_vocabulary_file()
    • subword_tokenize()
    • tokenize()
    • tokenize()
    • count_tokens()
    • count_tokens()
    • character_tokenize()
    • detokenize()
    • load_vocabulary()
    • tokenize_with_vocabulary()
    • load_wordpiece_vocabulary()
    • wordpiece_tokenize()
    • nvtext::bpe_merge_pairs
    • nvtext::hashed_vocabulary
    • nvtext::tokenizer_result
    • nvtext::tokenize_vocabulary
    • nvtext::wordpiece_vocabulary
  • Nvtext 替换
    • replace_tokens()
    • filter_tokens()
  • Nvtext Minhash
    • minhash()
    • minhash64()
    • minhash_ngrams()
    • minhash64_ngrams()
  • Nvtext Jaccard
    • jaccard_index()

上一页

集合操作

下一页

Nvtext Ngrams

当前页面

  • 显示源码

© Copyright 2018-2025, NVIDIA Corporation.

使用 Sphinx 8.2.3 创建。

使用 PyData Sphinx Theme 0.16.1 构建。