CSV#

class pylibcudf.io.csv.CsvReaderOptions#

read_csv 使用的设置。详情请参阅 cudf::io::csv_reader_options

方法

builder(SourceInfo source)

创建一个 CsvWriterOptionsBuilder 对象

set_comment(self, unicode comment)

设置注释行的起始字符。

set_delimiter(self, unicode delimiter)

设置字段分隔符。

set_dtypes(self, types)

设置每列的类型。

set_false_values(self, list false_values)

设置识别为布尔值 false 的额外值。

set_header(self, size_type header)

设置标题行的索引。

set_na_values(self, list na_values)

设置识别为空值的额外值。

set_names(self, list col_names)

设置列名。

set_parse_dates(self, list val)

设置要读取为 datetime 的列的索引或名称。

set_parse_hex(self, list val)

设置要解析为十六进制的列的索引或名称。

set_prefix(self, unicode prefix)

设置用于列 ID 的前缀。

set_thousands(self, unicode thousands)

设置数字数据的千位分隔符。

set_true_values(self, list true_values)

设置识别为布尔值 true 的额外值。

set_use_cols_indexes(self, list col_indices)

设置要读取的列的索引。

set_use_cols_names(self, list col_names)

设置要读取的列的名称。

static builder(SourceInfo source)#

创建一个 CsvWriterOptionsBuilder 对象

详情请参阅 cudf::io::csv_reader_options::builder()

参数:
sinkSourceInfo

用于读取 CSV 文件的源。

返回:
CsvReaderOptionsBuilder

构建 CsvReaderOptions 的构建器

set_comment(self, unicode comment) void#

设置注释行的起始字符。

参数:
commentstr

表示注释的字符

返回:
None
set_delimiter(self, unicode delimiter) void#

设置字段分隔符。

参数:
delimiterstr

表示分隔符的字符

返回:
None
set_dtypes(self, types) void#

设置每列的类型。

参数:
typesdict[str, data_type] | list[data_type]

列名到数据类型映射,指定列的目标数据类型。或指定列的目标数据类型的列表。

返回:
None
set_false_values(self, list false_values) void#

设置识别为布尔值 false 的额外值。

参数:
false_valueslist[str]

要视为 false 的值列表

返回:
None
set_header(self, size_type header) void#

设置标题行的索引。

参数:
headersize_type

标题行所在的索引

返回:
None
set_na_values(self, list na_values) void#

设置识别为空值的额外值。

参数:
na_valueslist[str]

要视为空值的值列表

返回:
None
set_names(self, list col_names) void#

设置列名。

参数:
col_nameslist[str]

列名列表

返回:
None
set_parse_dates(self, list val) void#

设置要读取为 datetime 的列的索引或名称。

参数:
vallist[int | str]

要推断为 datetime 的列索引或名称列表。

返回:
None
set_parse_hex(self, list val) void#

设置要解析为十六进制的列的索引或名称。

参数:
vallist[int | str]

要解析为十六进制的列索引或名称列表。

返回:
None
set_prefix(self, unicode prefix) void#

设置用于列 ID 的前缀。

参数:
prefixstr

用作每个列名的前缀的字符串

返回:
None
set_thousands(self, unicode thousands) void#

设置数字数据的千位分隔符。

参数:
thousandsstr

分隔千位的字符

返回:
None
set_true_values(self, list true_values) void#

设置识别为布尔值 true 的额外值。

参数:
true_valueslist[str]

要视为 true 的值列表

返回:
None
set_use_cols_indexes(self, list col_indices) void#

设置要读取的列的索引。

参数:
col_indiceslist[int]

需要的列索引列表

返回:
None
set_use_cols_names(self, list col_names) void#

设置要读取的列的名称。

参数:
col_nameslist[str]

需要的列索引列表

返回:
None
设置要读取的列的名称。

class pylibcudf.io.csv.CsvReaderOptionsBuilder#

用于构建 read_csv 选项的构建器

方法

详情请参阅 cudf::io::csv_reader_options_builder

build(self)

创建一个 CsvReaderOptions 对象

byte_range_offset(self, size_t byte_range_offset)

设置从源开始跳过的字节数。

byte_range_size(self, size_t byte_range_size)

设置要读取的字节数。

compression(self, compression_type compression)

设置源文件的压缩格式。

dayfirst(self, bool dayfirst)

设置是否将日期解析为 DD/MM 而不是 MM/DD。

decimal(self, unicode decimal)

设置小数点字符。

delim_whitespace(self, bool delim_whitespace)

设置是否将空白视作字段分隔符。

doublequote(self, bool doublequote)

设置值内部的引号是否双引号。

keep_default_na(self, bool keep_default_na)

设置是否保留内置的默认 NA 值。

lineterminator(self, unicode lineterminator)

设置行终止符。

mangle_dupe_cols(self, bool mangle_dupe_cols)

设置是否重命名重复的列名。

na_filter(self, bool na_filter)

设置是否禁用空值过滤。

nrows(self, size_type nrows)

设置要读取的行数。

quotechar(self, unicode quotechar)

设置引用字符。

quoting(self, quote_style quoting)

设置引用样式。

skip_blank_lines(self, bool skip_blank_lines)

设置是否忽略空行或将行值解析为无效。

skipfooter(self, size_type skipfooter)

设置从末尾跳过的行数。

skipinitialspace(self, bool skipinitialspace)

设置是否跳过分隔符后的空白。

skiprows(self, size_type skiprows)

设置从开始跳过的行数。

build(self)

build(self) CsvReaderOptions#

byte_range_offset(self, size_t byte_range_offset)

参数:
byte_range_offset(self, size_t byte_range_offset) CsvReaderOptionsBuilder#

byte_range_offsetsize_t

返回:
CsvReaderOptionsBuilder
偏移量(字节数)

byte_range_size(self, size_t byte_range_size)

参数:
byte_range_offset(self, size_t byte_range_offset) CsvReaderOptionsBuilder#

byte_range_size(self, size_t byte_range_size) CsvReaderOptionsBuilder#

返回:
CsvReaderOptionsBuilder
要读取的字节数

compression(self, compression_type compression)

参数:
compression(self, compression_type compression) CsvReaderOptionsBuilder#

compressioncompression_type

返回:
CsvReaderOptionsBuilder
压缩类型

dayfirst(self, bool dayfirst)

参数:
dayfirst(self, bool dayfirst) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
布尔值,用于启用/禁用

decimal(self, unicode decimal)

参数:
decimal(self, unicode decimal) CsvReaderOptionsBuilder#

quotecharstr

返回:
CsvReaderOptionsBuilder
表示小数值的字符

delim_whitespace(self, bool delim_whitespace)

参数:
delim_whitespace(self, bool delim_whitespace) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
delim_whitespacebool

doublequote(self, bool doublequote)

参数:
doublequote(self, bool doublequote) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
doublequotebool

keep_default_na(self, bool keep_default_na)

参数:
keep_default_na(self, bool keep_default_na) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
keep_default_nabool

lineterminator(self, unicode lineterminator)

参数:
lineterminator(self, unicode lineterminator) CsvReaderOptionsBuilder#

quotingstr

返回:
CsvReaderOptionsBuilder
表示行终止的字符

mangle_dupe_cols(self, bool mangle_dupe_cols)

参数:
mangle_dupe_cols(self, bool mangle_dupe_cols) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
mangle_dupe_colsbool

na_filter(self, bool na_filter)

参数:
na_filter(self, bool na_filter) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
na_filterbool

nrows(self, size_type nrows)

参数:
nrows(self, size_type nrows) CsvReaderOptionsBuilder#

nrowssize_type

返回:
CsvReaderOptionsBuilder
要读取的行数

quotechar(self, unicode quotechar)

参数:
decimal(self, unicode decimal) CsvReaderOptionsBuilder#

quotechar(self, unicode quotechar) CsvReaderOptionsBuilder#

返回:
CsvReaderOptionsBuilder
表示引用的字符

quoting(self, quote_style quoting)

参数:
quoting(self, quote_style quoting) CsvReaderOptionsBuilder#

quotingquote_style

返回:
CsvReaderOptionsBuilder
使用的引用样式

skip_blank_lines(self, bool skip_blank_lines)

参数:
skip_blank_lines(self, bool skip_blank_lines) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
skip_blank_linesbool

skipfooter(self, size_type skipfooter)

参数:
skipfooter(self, size_type skipfooter) CsvReaderOptionsBuilder#

skipfootersize_type

返回:
CsvReaderOptionsBuilder
要跳过的行数

skipinitialspace(self, bool skipinitialspace)

参数:
skipinitialspace(self, bool skipinitialspace) CsvReaderOptionsBuilder#

dayfirstbool

返回:
CsvReaderOptionsBuilder
skipinitialspacebool

skiprows(self, size_type skiprows)

参数:
skiprows(self, size_type skiprows) CsvReaderOptionsBuilder#

skipfootersize_type

返回:
CsvReaderOptionsBuilder
skiprowssize_type

class pylibcudf.io.csv.CsvWriterOptions#

write_csv 使用的设置。

方法

详情请参阅 cudf::io::csv_writer_options

创建一个 CsvWriterOptionsBuilder 对象

builder(SinkInfo sink, Table table)

创建一个 CsvWriterOptionsBuilder 对象

static builder(SinkInfo sink, Table table)#

参数:
详情请参阅 cudf::io::csv_writer_options::builder()

sinkSinkInfo

用于编写器输出的接收器

tableTable

返回:
要写入到输出的表

CsvWriterOptionsBuilder

构建 CsvWriterOptions 的构建器

class pylibcudf.io.csv.CsvWriterOptionsBuilder#

用于构建 write_csv 选项的构建器

方法

详情请参阅 cudf::io::csv_writer_options_builder

build(self)

创建一个 CsvWriterOptions 对象

false_value(self, unicode val)

设置用于表示值 == 0 的字符串

include_header(self, bool val)

启用/禁用将标题写入 csv。

inter_column_delimiter(self, unicode delim)

设置用于分隔列值的字符。

line_terminator(self, unicode term)

设置用于分隔行的字符。

na_rep(self, unicode val)

设置用于表示空条目的字符串。

names(self, list names)

设置可选列名。

rows_per_chunk(self, int val)

设置每次文件写入处理的最大行数。

true_value(self, unicode val)

设置用于表示值 != 0 的字符串

build(self)

build(self) CsvWriterOptions#

false_value(self, unicode val)

参数:
false_value(self, unicode val) CsvWriterOptionsBuilder#

valstr

返回:
要写入到输出的表

CsvWriterOptionsBuilder

表示值 == 0 的字符串

include_header(self, bool val)

参数:
include_header(self, bool val) CsvWriterOptionsBuilder#

dayfirstbool

返回:
要写入到输出的表

CsvWriterOptionsBuilder

valbool

inter_column_delimiter(self, unicode delim)

参数:
inter_column_delimiter(self, unicode delim) CsvWriterOptionsBuilder#

delimstr

返回:
要写入到输出的表

CsvWriterOptionsBuilder

分隔列值的字符

line_terminator(self, unicode term)

参数:
line_terminator(self, unicode term) CsvWriterOptionsBuilder#

termstr

返回:
要写入到输出的表

CsvWriterOptionsBuilder

表示行终止的字符

na_rep(self, unicode val)

参数:
false_value(self, unicode val) CsvWriterOptionsBuilder#

na_rep(self, unicode val) CsvWriterOptionsBuilder#

返回:
要写入到输出的表

CsvWriterOptionsBuilder

表示空值的字符串

names(self, list names)

参数:
names(self, list names) CsvWriterOptionsBuilder#

nameslist[str]

返回:
要写入到输出的表

CsvWriterOptionsBuilder

列名

rows_per_chunk(self, int val)

参数:
rows_per_chunk(self, int val) CsvWriterOptionsBuilder#

valint

返回:
要写入到输出的表

CsvWriterOptionsBuilder

每个块的行数

true_value(self, unicode val)

参数:
false_value(self, unicode val) CsvWriterOptionsBuilder#

true_value(self, unicode val) CsvWriterOptionsBuilder#

返回:
要写入到输出的表

CsvWriterOptionsBuilder

表示值 != 0 的字符串

pylibcudf.io.csv.read_csv(CsvReaderOptions options, Stream stream=None) TableWithMetadata#

从 CSV 格式读取。

要读取的源和选项由 options 对象封装。

参数:
详情请参阅 read_csv()

options: CsvReaderOptions

用于控制读取行为的设置

stream: Stream

用于设备内存操作和内核启动的 CUDA 流

pylibcudf.io.csv.write_csv(CsvWriterOptions options, Stream stream=None) void#

写入为 CSV 格式。

要写入的表、输出路径和选项由 options 对象封装。

参数:
详情请参阅 write_csv()

options: CsvWriterOptions

用于控制读取行为的设置

stream: Stream

用于控制写入行为的设置