CSV#
- class pylibcudf.io.csv.CsvReaderOptions#
read_csv
使用的设置。详情请参阅cudf::io::csv_reader_options
方法
builder
(SourceInfo source)创建一个 CsvWriterOptionsBuilder 对象
set_comment
(self, unicode comment)设置注释行的起始字符。
set_delimiter
(self, unicode delimiter)设置字段分隔符。
set_dtypes
(self, types)设置每列的类型。
set_false_values
(self, list false_values)设置识别为布尔值 false 的额外值。
set_header
(self, size_type header)设置标题行的索引。
set_na_values
(self, list na_values)设置识别为空值的额外值。
set_names
(self, list col_names)设置列名。
set_parse_dates
(self, list val)设置要读取为 datetime 的列的索引或名称。
set_parse_hex
(self, list val)设置要解析为十六进制的列的索引或名称。
set_prefix
(self, unicode prefix)设置用于列 ID 的前缀。
set_thousands
(self, unicode thousands)设置数字数据的千位分隔符。
set_true_values
(self, list true_values)设置识别为布尔值 true 的额外值。
set_use_cols_indexes
(self, list col_indices)设置要读取的列的索引。
set_use_cols_names
(self, list col_names)设置要读取的列的名称。
- static builder(SourceInfo source)#
创建一个 CsvWriterOptionsBuilder 对象
详情请参阅
cudf::io::csv_reader_options::builder()
- 参数:
- sinkSourceInfo
用于读取 CSV 文件的源。
- 返回:
- CsvReaderOptionsBuilder
构建 CsvReaderOptions 的构建器
- set_comment(self, unicode comment) void #
设置注释行的起始字符。
- 参数:
- commentstr
表示注释的字符
- 返回:
- None
- set_delimiter(self, unicode delimiter) void #
设置字段分隔符。
- 参数:
- delimiterstr
表示分隔符的字符
- 返回:
- None
- set_dtypes(self, types) void #
设置每列的类型。
- 参数:
- typesdict[str, data_type] | list[data_type]
列名到数据类型映射,指定列的目标数据类型。或指定列的目标数据类型的列表。
- 返回:
- None
- set_false_values(self, list false_values) void #
设置识别为布尔值 false 的额外值。
- 参数:
- false_valueslist[str]
要视为 false 的值列表
- 返回:
- None
- set_header(self, size_type header) void #
设置标题行的索引。
- 参数:
- headersize_type
标题行所在的索引
- 返回:
- None
- set_na_values(self, list na_values) void #
设置识别为空值的额外值。
- 参数:
- na_valueslist[str]
要视为空值的值列表
- 返回:
- None
- set_names(self, list col_names) void #
设置列名。
- 参数:
- col_nameslist[str]
列名列表
- 返回:
- None
- set_parse_dates(self, list val) void #
设置要读取为 datetime 的列的索引或名称。
- 参数:
- vallist[int | str]
要推断为 datetime 的列索引或名称列表。
- 返回:
- None
- set_parse_hex(self, list val) void #
设置要解析为十六进制的列的索引或名称。
- 参数:
- vallist[int | str]
要解析为十六进制的列索引或名称列表。
- 返回:
- None
- set_prefix(self, unicode prefix) void #
设置用于列 ID 的前缀。
- 参数:
- prefixstr
用作每个列名的前缀的字符串
- 返回:
- None
- set_thousands(self, unicode thousands) void #
设置数字数据的千位分隔符。
- 参数:
- thousandsstr
分隔千位的字符
- 返回:
- None
- set_true_values(self, list true_values) void #
设置识别为布尔值 true 的额外值。
- 参数:
- true_valueslist[str]
要视为 true 的值列表
- 返回:
- None
- set_use_cols_indexes(self, list col_indices) void #
设置要读取的列的索引。
- 参数:
- col_indiceslist[int]
需要的列索引列表
- 返回:
- None
- set_use_cols_names(self, list col_names) void #
设置要读取的列的名称。
- 参数:
- col_nameslist[str]
需要的列索引列表
- 返回:
- None
- 设置要读取的列的名称。
class pylibcudf.io.csv.CsvReaderOptionsBuilder#
用于构建
read_csv
选项的构建器方法
build
(self)创建一个 CsvReaderOptions 对象
byte_range_offset
(self, size_t byte_range_offset)设置从源开始跳过的字节数。
byte_range_size
(self, size_t byte_range_size)设置要读取的字节数。
compression
(self, compression_type compression)设置源文件的压缩格式。
dayfirst
(self, bool dayfirst)设置是否将日期解析为 DD/MM 而不是 MM/DD。
decimal
(self, unicode decimal)设置小数点字符。
delim_whitespace
(self, bool delim_whitespace)设置是否将空白视作字段分隔符。
doublequote
(self, bool doublequote)设置值内部的引号是否双引号。
keep_default_na
(self, bool keep_default_na)设置是否保留内置的默认 NA 值。
lineterminator
(self, unicode lineterminator)设置行终止符。
mangle_dupe_cols
(self, bool mangle_dupe_cols)设置是否重命名重复的列名。
na_filter
(self, bool na_filter)设置是否禁用空值过滤。
nrows
(self, size_type nrows)设置要读取的行数。
quotechar
(self, unicode quotechar)设置引用字符。
quoting
(self, quote_style quoting)设置引用样式。
skip_blank_lines
(self, bool skip_blank_lines)设置是否忽略空行或将行值解析为无效。
skipfooter
(self, size_type skipfooter)设置从末尾跳过的行数。
skipinitialspace
(self, bool skipinitialspace)设置是否跳过分隔符后的空白。
skiprows
(self, size_type skiprows)- 设置从开始跳过的行数。
build
(self)
- build(self) CsvReaderOptions #
byte_range_offset
(self, size_t byte_range_offset)- 参数:
- byte_range_offset(self, size_t byte_range_offset) CsvReaderOptionsBuilder #
byte_range_offsetsize_t
- 返回:
- CsvReaderOptionsBuilder
- 偏移量(字节数)
byte_range_size
(self, size_t byte_range_size)- 参数:
- byte_range_offset(self, size_t byte_range_offset) CsvReaderOptionsBuilder #
byte_range_size(self, size_t byte_range_size) CsvReaderOptionsBuilder #
- 返回:
- CsvReaderOptionsBuilder
- 要读取的字节数
compression
(self, compression_type compression)- 参数:
- compression(self, compression_type compression) CsvReaderOptionsBuilder #
compressioncompression_type
- 返回:
- CsvReaderOptionsBuilder
- 压缩类型
dayfirst
(self, bool dayfirst)- 参数:
- dayfirst(self, bool dayfirst) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- 布尔值,用于启用/禁用
decimal
(self, unicode decimal)- 参数:
- decimal(self, unicode decimal) CsvReaderOptionsBuilder #
quotecharstr
- 返回:
- CsvReaderOptionsBuilder
- 表示小数值的字符
delim_whitespace
(self, bool delim_whitespace)- 参数:
- delim_whitespace(self, bool delim_whitespace) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- delim_whitespacebool
doublequote
(self, bool doublequote)- 参数:
- doublequote(self, bool doublequote) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- doublequotebool
keep_default_na
(self, bool keep_default_na)- 参数:
- keep_default_na(self, bool keep_default_na) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- keep_default_nabool
lineterminator
(self, unicode lineterminator)- 参数:
- lineterminator(self, unicode lineterminator) CsvReaderOptionsBuilder #
quotingstr
- 返回:
- CsvReaderOptionsBuilder
- 表示行终止的字符
mangle_dupe_cols
(self, bool mangle_dupe_cols)- 参数:
- mangle_dupe_cols(self, bool mangle_dupe_cols) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- mangle_dupe_colsbool
na_filter
(self, bool na_filter)- 参数:
- na_filter(self, bool na_filter) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- na_filterbool
nrows
(self, size_type nrows)- 参数:
- nrows(self, size_type nrows) CsvReaderOptionsBuilder #
nrowssize_type
- 返回:
- CsvReaderOptionsBuilder
- 要读取的行数
quotechar
(self, unicode quotechar)- 参数:
- decimal(self, unicode decimal) CsvReaderOptionsBuilder #
quotechar(self, unicode quotechar) CsvReaderOptionsBuilder #
- 返回:
- CsvReaderOptionsBuilder
- 表示引用的字符
quoting
(self, quote_style quoting)- 参数:
- quoting(self, quote_style quoting) CsvReaderOptionsBuilder #
quotingquote_style
- 返回:
- CsvReaderOptionsBuilder
- 使用的引用样式
skip_blank_lines
(self, bool skip_blank_lines)- 参数:
- skip_blank_lines(self, bool skip_blank_lines) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
skipfooter
(self, size_type skipfooter)- 参数:
- skipfooter(self, size_type skipfooter) CsvReaderOptionsBuilder #
skipfootersize_type
- 返回:
- CsvReaderOptionsBuilder
- 要跳过的行数
skipinitialspace
(self, bool skipinitialspace)- 参数:
- skipinitialspace(self, bool skipinitialspace) CsvReaderOptionsBuilder #
dayfirstbool
- 返回:
- CsvReaderOptionsBuilder
- skipinitialspacebool
skiprows
(self, size_type skiprows)- 参数:
- skiprows(self, size_type skiprows) CsvReaderOptionsBuilder #
skipfootersize_type
- 返回:
- CsvReaderOptionsBuilder
- skiprowssize_type
class pylibcudf.io.csv.CsvWriterOptions#
write_csv
使用的设置。方法
创建一个 CsvWriterOptionsBuilder 对象
-
builder
(SinkInfo sink, Table table) 创建一个 CsvWriterOptionsBuilder 对象
static builder(SinkInfo sink, Table table)#
- 参数:
- 详情请参阅
cudf::io::csv_writer_options::builder()
sinkSinkInfo
- 用于编写器输出的接收器
tableTable
- 详情请参阅
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
-
- 构建 CsvWriterOptions 的构建器
class pylibcudf.io.csv.CsvWriterOptionsBuilder#
用于构建
write_csv
选项的构建器方法
build
(self)创建一个 CsvWriterOptions 对象
false_value
(self, unicode val)设置用于表示值 == 0 的字符串
include_header
(self, bool val)启用/禁用将标题写入 csv。
inter_column_delimiter
(self, unicode delim)设置用于分隔列值的字符。
line_terminator
(self, unicode term)设置用于分隔行的字符。
na_rep
(self, unicode val)设置用于表示空条目的字符串。
names
(self, list names)设置可选列名。
rows_per_chunk
(self, int val)设置每次文件写入处理的最大行数。
true_value
(self, unicode val)- 设置用于表示值 != 0 的字符串
build
(self)
- build(self) CsvWriterOptions #
false_value
(self, unicode val)- 参数:
- false_value(self, unicode val) CsvWriterOptionsBuilder #
valstr
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示值 == 0 的字符串
include_header
(self, bool val)- 参数:
- include_header(self, bool val) CsvWriterOptionsBuilder #
dayfirstbool
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- valbool
inter_column_delimiter
(self, unicode delim)- 参数:
- inter_column_delimiter(self, unicode delim) CsvWriterOptionsBuilder #
delimstr
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 分隔列值的字符
line_terminator
(self, unicode term)- 参数:
- line_terminator(self, unicode term) CsvWriterOptionsBuilder #
termstr
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示行终止的字符
na_rep
(self, unicode val)- 参数:
- false_value(self, unicode val) CsvWriterOptionsBuilder #
na_rep(self, unicode val) CsvWriterOptionsBuilder #
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示空值的字符串
names
(self, list names)- 参数:
- names(self, list names) CsvWriterOptionsBuilder #
nameslist[str]
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 列名
rows_per_chunk
(self, int val)- 参数:
- rows_per_chunk(self, int val) CsvWriterOptionsBuilder #
valint
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 每个块的行数
true_value
(self, unicode val)- 参数:
- false_value(self, unicode val) CsvWriterOptionsBuilder #
true_value(self, unicode val) CsvWriterOptionsBuilder #
- 返回:
- 要写入到输出的表
CsvWriterOptionsBuilder
- 表示值 != 0 的字符串
pylibcudf.io.csv.read_csv(CsvReaderOptions options, Stream stream=None) TableWithMetadata #
从 CSV 格式读取。
要读取的源和选项由 options 对象封装。
- 参数:
- 详情请参阅
read_csv()
。 options: CsvReaderOptions
- 用于控制读取行为的设置
stream: Stream
- 详情请参阅
- 用于设备内存操作和内核启动的 CUDA 流
pylibcudf.io.csv.write_csv(CsvWriterOptions options, Stream stream=None) void #
写入为 CSV 格式。
要写入的表、输出路径和选项由 options 对象封装。
- 参数:
- 详情请参阅
write_csv()
。 options: CsvWriterOptions
- 用于控制读取行为的设置
stream: Stream
- 详情请参阅