CSV#
- class pylibcudf.io.csv.CsvReaderOptions#
read_csv使用的设置。详情请参阅cudf::io::csv_reader_options方法
builder(SourceInfo source)创建一个 CsvWriterOptionsBuilder 对象
set_comment(self, unicode comment)设置注释行的起始字符。
set_delimiter(self, unicode delimiter)设置字段分隔符。
set_dtypes(self, types)设置每列的类型。
set_false_values(self, list false_values)设置识别为布尔值 false 的额外值。
set_header(self, size_type header)设置标题行的索引。
set_na_values(self, list na_values)设置识别为空值的额外值。
set_names(self, list col_names)设置列名。
set_parse_dates(self, list val)设置要读取为 datetime 的列的索引或名称。
set_parse_hex(self, list val)设置要解析为十六进制的列的索引或名称。
set_prefix(self, unicode prefix)设置用于列 ID 的前缀。
set_thousands(self, unicode thousands)设置数字数据的千位分隔符。
set_true_values(self, list true_values)设置识别为布尔值 true 的额外值。
set_use_cols_indexes(self, list col_indices)设置要读取的列的索引。
set_use_cols_names(self, list col_names)设置要读取的列的名称。
- static builder(SourceInfo source)#
创建一个 CsvWriterOptionsBuilder 对象
详情请参阅
cudf::io::csv_reader_options::builder()- 参数:
- sinkSourceInfo
用于读取 CSV 文件的源。
- 返回:
- CsvReaderOptionsBuilder
构建 CsvReaderOptions 的构建器
- set_comment(self, unicode comment) void#
设置注释行的起始字符。
- 参数:
- commentstr
表示注释的字符
- 返回:
- None
- set_delimiter(self, unicode delimiter) void#
设置字段分隔符。
- 参数:
- delimiterstr
表示分隔符的字符
- 返回:
- None
- set_dtypes(self, types) void#
设置每列的类型。
- 参数:
- typesdict[str, data_type] | list[data_type]
列名到数据类型映射,指定列的目标数据类型。或指定列的目标数据类型的列表。
- 返回:
- None
- set_false_values(self, list false_values) void#
设置识别为布尔值 false 的额外值。
- 参数:
- false_valueslist[str]
要视为 false 的值列表
- 返回:
- None
- set_header(self, size_type header) void#
设置标题行的索引。
- 参数:
- headersize_type
标题行所在的索引
- 返回:
- None
- set_na_values(self, list na_values) void#
设置识别为空值的额外值。
- 参数:
- na_valueslist[str]
要视为空值的值列表
- 返回:
- None
- set_names(self, list col_names) void#
设置列名。
- 参数:
- col_nameslist[str]
列名列表
- 返回:
- None
- set_parse_dates(self, list val) void#
设置要读取为 datetime 的列的索引或名称。
- 参数:
- vallist[int | str]
要推断为 datetime 的列索引或名称列表。
- 返回:
- None
- set_parse_hex(self, list val) void#
设置要解析为十六进制的列的索引或名称。
- 参数:
- vallist[int | str]
要解析为十六进制的列索引或名称列表。
- 返回:
- None
- set_prefix(self, unicode prefix) void#
设置用于列 ID 的前缀。
- 参数:
- prefixstr
用作每个列名的前缀的字符串
- 返回:
- None
- set_thousands(self, unicode thousands) void#
设置数字数据的千位分隔符。
- 参数:
- thousandsstr
分隔千位的字符
- 返回:
- None
- set_true_values(self, list true_values) void#
设置识别为布尔值 true 的额外值。
- 参数:
- true_valueslist[str]
要视为 true 的值列表
- 返回:
- None
- set_use_cols_indexes(self, list col_indices) void#
设置要读取的列的索引。
- 参数:
- col_indiceslist[int]
需要的列索引列表
- 返回:
- None
- set_use_cols_names(self, list col_names) void#
设置要读取的列的名称。
- 参数:
- col_nameslist[str]
需要的列索引列表
- 返回:
- None
- 设置要读取的列的名称。
class pylibcudf.io.csv.CsvReaderOptionsBuilder#
用于构建
read_csv选项的构建器方法
build(self)创建一个 CsvReaderOptions 对象
byte_range_offset(self, size_t byte_range_offset)设置从源开始跳过的字节数。
byte_range_size(self, size_t byte_range_size)设置要读取的字节数。
compression(self, compression_type compression)设置源文件的压缩格式。
dayfirst(self, bool dayfirst)设置是否将日期解析为 DD/MM 而不是 MM/DD。
decimal(self, unicode decimal)设置小数点字符。
delim_whitespace(self, bool delim_whitespace)设置是否将空白视作字段分隔符。
doublequote(self, bool doublequote)设置值内部的引号是否双引号。
keep_default_na(self, bool keep_default_na)设置是否保留内置的默认 NA 值。
lineterminator(self, unicode lineterminator)设置行终止符。
mangle_dupe_cols(self, bool mangle_dupe_cols)设置是否重命名重复的列名。
na_filter(self, bool na_filter)设置是否禁用空值过滤。
nrows(self, size_type nrows)设置要读取的行数。
quotechar(self, unicode quotechar)设置引用字符。
quoting(self, quote_style quoting)设置引用样式。
skip_blank_lines(self, bool skip_blank_lines)设置是否忽略空行或将行值解析为无效。
skipfooter(self, size_type skipfooter)设置从末尾跳过的行数。
skipinitialspace(self, bool skipinitialspace)设置是否跳过分隔符后的空白。
skiprows(self, size_type skiprows)- 设置从开始跳过的行数。
build(self)
- build(self) CsvReaderOptions#
byte_range_offset(self, size_t byte_range_offset)- 参数:
- byte_range_offset(self, size_t byte_range_offset) CsvReaderOptionsBuilder#
byte_range_offsetsize_t
- 返回:
- CsvReaderOptionsBuilder
- 偏移量(字节数)
byte_range_size(self, size_t byte_range_size)- 参数:
- byte_range_offset(self, size_t byte_range_offset) CsvReaderOptionsBuilder#
byte_range_size(self, size_t byte_range_size) CsvReaderOptionsBuilder#
- 返回:
- CsvReaderOptionsBuilder
- 要读取的字节数
compression(self, compression_type compression)- 参数:
- compression(self, compression_type compression) CsvReaderOptionsBuilder#
compressioncompression_type
- 返回:
- CsvReaderOptionsBuilder
- 压缩类型
dayfirst(self, bool dayfirst)- 参数:
- dayfirst(self, bool dayfirst) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- 布尔值,用于启用/禁用
decimal(self, unicode decimal)- 参数:
- decimal(self, unicode decimal) CsvReaderOptionsBuilder#
quotecharstr
- 返回:
- CsvReaderOptionsBuilder
- 表示小数值的字符
delim_whitespace(self, bool delim_whitespace)- 参数:
- delim_whitespace(self, bool delim_whitespace) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- delim_whitespacebool
doublequote(self, bool doublequote)- 参数:
- doublequote(self, bool doublequote) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- doublequotebool
keep_default_na(self, bool keep_default_na)- 参数:
- keep_default_na(self, bool keep_default_na) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- keep_default_nabool
lineterminator(self, unicode lineterminator)- 参数:
- lineterminator(self, unicode lineterminator) CsvReaderOptionsBuilder#
quotingstr
- 返回:
- CsvReaderOptionsBuilder
- 表示行终止的字符
mangle_dupe_cols(self, bool mangle_dupe_cols)- 参数:
- mangle_dupe_cols(self, bool mangle_dupe_cols) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- mangle_dupe_colsbool
na_filter(self, bool na_filter)- 参数:
- na_filter(self, bool na_filter) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- na_filterbool
nrows(self, size_type nrows)- 参数:
- nrows(self, size_type nrows) CsvReaderOptionsBuilder#
nrowssize_type
- 返回:
- CsvReaderOptionsBuilder
- 要读取的行数
quotechar(self, unicode quotechar)- 参数:
- decimal(self, unicode decimal) CsvReaderOptionsBuilder#
quotechar(self, unicode quotechar) CsvReaderOptionsBuilder#
- 返回:
- CsvReaderOptionsBuilder
- 表示引用的字符
quoting(self, quote_style quoting)- 参数:
- quoting(self, quote_style quoting) CsvReaderOptionsBuilder#
quotingquote_style
- 返回:
- CsvReaderOptionsBuilder
- 使用的引用样式
skip_blank_lines(self, bool skip_blank_lines)- 参数:
- skip_blank_lines(self, bool skip_blank_lines) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
skipfooter(self, size_type skipfooter)- 参数:
- skipfooter(self, size_type skipfooter) CsvReaderOptionsBuilder#
skipfootersize_type
- 返回:
- CsvReaderOptionsBuilder
- 要跳过的行数
skipinitialspace(self, bool skipinitialspace)- 参数:
- skipinitialspace(self, bool skipinitialspace) CsvReaderOptionsBuilder#
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- skipinitialspacebool
skiprows(self, size_type skiprows)- 参数:
- skiprows(self, size_type skiprows) CsvReaderOptionsBuilder#
skipfootersize_type
- 返回:
- CsvReaderOptionsBuilder
- skiprowssize_type
class pylibcudf.io.csv.CsvWriterOptions#
write_csv使用的设置。方法
创建一个 CsvWriterOptionsBuilder 对象
-
builder(SinkInfo sink, Table table) 创建一个 CsvWriterOptionsBuilder 对象
static builder(SinkInfo sink, Table table)#
- 参数:
- 详情请参阅
cudf::io::csv_writer_options::builder() sinkSinkInfo
- 用于编写器输出的接收器
tableTable
- 详情请参阅
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
-
- 构建 CsvWriterOptions 的构建器
class pylibcudf.io.csv.CsvWriterOptionsBuilder#
用于构建
write_csv选项的构建器方法
build(self)创建一个 CsvWriterOptions 对象
false_value(self, unicode val)设置用于表示值 == 0 的字符串
include_header(self, bool val)启用/禁用将标题写入 csv。
inter_column_delimiter(self, unicode delim)设置用于分隔列值的字符。
line_terminator(self, unicode term)设置用于分隔行的字符。
na_rep(self, unicode val)设置用于表示空条目的字符串。
names(self, list names)设置可选列名。
rows_per_chunk(self, int val)设置每次文件写入处理的最大行数。
true_value(self, unicode val)- 设置用于表示值 != 0 的字符串
build(self)
- build(self) CsvWriterOptions#
false_value(self, unicode val)- 参数:
- false_value(self, unicode val) CsvWriterOptionsBuilder#
valstr
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示值 == 0 的字符串
include_header(self, bool val)- 参数:
- include_header(self, bool val) CsvWriterOptionsBuilder#
dayfirstbool
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- valbool
inter_column_delimiter(self, unicode delim)- 参数:
- inter_column_delimiter(self, unicode delim) CsvWriterOptionsBuilder#
delimstr
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 分隔列值的字符
line_terminator(self, unicode term)- 参数:
- line_terminator(self, unicode term) CsvWriterOptionsBuilder#
termstr
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示行终止的字符
na_rep(self, unicode val)- 参数:
- false_value(self, unicode val) CsvWriterOptionsBuilder#
na_rep(self, unicode val) CsvWriterOptionsBuilder#
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示空值的字符串
names(self, list names)- 参数:
- names(self, list names) CsvWriterOptionsBuilder#
nameslist[str]
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 列名
rows_per_chunk(self, int val)- 参数:
- rows_per_chunk(self, int val) CsvWriterOptionsBuilder#
valint
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 每个块的行数
true_value(self, unicode val)- 参数:
- false_value(self, unicode val) CsvWriterOptionsBuilder#
true_value(self, unicode val) CsvWriterOptionsBuilder#
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示值 != 0 的字符串
pylibcudf.io.csv.read_csv(CsvReaderOptions options, Stream stream=None) TableWithMetadata#
从 CSV 格式读取。
要读取的源和选项由 options 对象封装。
- 参数:
- 详情请参阅
read_csv()。 options: CsvReaderOptions
- 用于控制读取行为的设置
stream: Stream
- 详情请参阅
- 用于设备内存操作和内核启动的 CUDA 流
pylibcudf.io.csv.write_csv(CsvWriterOptions options, Stream stream=None) void#
写入为 CSV 格式。
要写入的表、输出路径和选项由 options 对象封装。
- 参数:
- 详情请参阅
write_csv()。 options: CsvWriterOptions
- 用于控制读取行为的设置
stream: Stream
- 详情请参阅