公共成员函数 | 静态公共成员函数 | 所有成员列表
cudf::io::csv_reader_options 类参考

用于 read_csv() 的设置。 更多...

#include <csv.hpp>

公共成员函数

 csv_reader_options ()=default
 默认构造函数。 更多...
 
source_info const & get_source () const
 返回源信息。 更多...
 
compression_type get_compression () const
 返回源的压缩格式。 更多...
 
std::size_t get_byte_range_offset () const
 返回从源开始跳过的字节数。 更多...
 
std::size_t get_byte_range_size () const
 返回要读取的字节数。 更多...
 
std::size_t get_byte_range_size_with_padding () const
 返回带填充的要读取的字节数。 更多...
 
std::size_t get_byte_range_padding () const
 返回读取时要填充的字节数。 更多...
 
std::vector< std::string > const & get_names () const
 返回列名。 更多...
 
std::string get_prefix () const
 返回用于列 ID 的前缀。 更多...
 
bool is_enabled_mangle_dupe_cols () const
 是否重命名重复的列名。 更多...
 
std::vector< std::string > const & get_use_cols_names () const
 返回要读取的列名。 更多...
 
std::vector< int > const & get_use_cols_indexes () const
 返回要读取的列索引。 更多...
 
size_type get_nrows () const
 返回要读取的行数。 更多...
 
size_type get_skiprows () const
 返回从头跳过的行数。 更多...
 
size_type get_skipfooter () const
 返回从尾跳过的行数。 更多...
 
size_type get_header () const
 返回标题行索引。 更多...
 
char get_lineterminator () const
 返回行终止符。 更多...
 
char get_delimiter () const
 返回字段分隔符。 更多...
 
char get_thousands () const
 返回数字数据千位分隔符。 更多...
 
char get_decimal () const
 返回小数点字符。 更多...
 
char get_comment () const
 返回注释行起始字符。 更多...
 
bool is_enabled_windowslinetermination () const
 是否将 \r\n 视为行终止符。 更多...
 
bool is_enabled_delim_whitespace () const
 是否将空白字符视为字段分隔符。 更多...
 
bool is_enabled_skipinitialspace () const
 是否跳过分隔符后的空白字符。 更多...
 
bool is_enabled_skip_blank_lines () const
 是否忽略空行或将行值解析为无效。 更多...
 
quote_style get_quoting () const
 返回引用样式。 更多...
 
char get_quotechar () const
 返回引用字符。 更多...
 
bool is_enabled_doublequote () const
 值内部的引用是否被双重引用。 更多...
 
bool is_enabled_detect_whitespace_around_quotes () const
 是否检测被空格包围的引用,例如 "data"。当 _doublequote 为 true 时,此标志无效。 更多...
 
std::vector< std::string > const & get_parse_dates_names () const
 返回要作为 datetime 读取的列名。 更多...
 
std::vector< int > const & get_parse_dates_indexes () const
 返回要作为 datetime 读取的列索引。 更多...
 
std::vector< std::string > const & get_parse_hex_names () const
 返回要作为十六进制读取的列名。 更多...
 
std::vector< int > const & get_parse_hex_indexes () const
 返回要作为十六进制读取的列索引。 更多...
 
std::variant< std::vector< data_type >, std::map< std::string, data_type > > const & get_dtypes () const
 返回每列的数据类型。 更多...
 
std::vector< std::string > const & get_true_values () const
 返回要识别为布尔真值的附加值。 更多...
 
std::vector< std::string > const & get_false_values () const
 返回要识别为布尔假值的附加值。 更多...
 
std::vector< std::string > const & get_na_values () const
 返回要识别为空值的附加值。 更多...
 
bool is_enabled_keep_default_na () const
 是否保留内置的默认 NA 值。 更多...
 
bool is_enabled_na_filter () const
 是否禁用空值过滤。 更多...
 
bool is_enabled_dayfirst () const
 是否将日期解析为 DD/MM 而非 MM/DD。 更多...
 
data_type get_timestamp_type () const
 返回 timestamp_type,所有时间戳列都将转换为此类型。 更多...
 
void set_compression (compression_type comp)
 设置源的压缩格式。 更多...
 
void set_byte_range_offset (std::size_t offset)
 设置从源开始跳过的字节数。 更多...
 
void set_byte_range_size (std::size_t size)
 设置要读取的字节数。 更多...
 
void set_names (std::vector< std::string > col_names)
 设置列名。 更多...
 
void set_prefix (std::string pfx)
 设置用于列 ID 的前缀。 更多...
 
void enable_mangle_dupe_cols (bool val)
 设置是否重命名重复的列名。 更多...
 
void set_use_cols_names (std::vector< std::string > col_names)
 设置要读取的列名。 更多...
 
void set_use_cols_indexes (std::vector< int > col_indices)
 设置要读取的列索引。 更多...
 
void size_type 
 set_nrows (size_type nrows)
 
void 设置要读取的行数。 更多...
 set_skiprows (size_type skiprows)
 
void 设置从头跳过的行数。 更多...
 set_skipfooter (size_type skipfooter)
 
void 设置从尾跳过的行数。 更多...
 set_header (size_type hdr)
 
void 设置标题行索引。 更多...
 set_lineterminator (char term)
 
void 设置行终止符。 更多...
 set_delimiter (char delim)
 
void 设置字段分隔符。 更多...
 set_thousands (char val)
 
void 设置数字数据千位分隔符。 更多...
 set_decimal (char val)
 
void 设置小数点字符。 更多...
 set_comment (char val)
 
void 设置注释行起始字符。 更多...
 enable_windowslinetermination (bool val)
 
void 设置是否将 \r\n 视为行终止符。 更多...
 enable_delim_whitespace (bool val)
 
void 设置是否将空白字符视为字段分隔符。 更多...
 enable_skipinitialspace (bool val)
 
void 设置是否跳过分隔符后的空白字符。 更多...
 enable_skip_blank_lines (bool val)
 
void 设置是否忽略空行或将行值解析为无效。 更多...
 set_quoting (quote_style quoting)
 
void 设置输入 CSV 数据中使用的预期引用样式。 更多...
 set_quotechar (char ch)
 
void 设置引用字符。 更多...
 enable_doublequote (bool val)
 
void 设置值内部的引用是否被双重引用。 更多...
 enable_detect_whitespace_around_quotes (bool val)
 
void 设置是否检测被空格包围的引用,例如 "data"。当 _doublequote 为 true 时,此标志无效。 更多...
 set_parse_dates (std::vector< std::string > col_names)
 
void 设置要作为 datetime 读取的列名。 更多...
 set_parse_dates (std::vector< int > col_indices)
 
void 设置要作为 datetime 读取的列索引。 更多...
 set_parse_hex (std::vector< std::string > col_names)
 
void 设置要作为十六进制解析的列名。 更多...
 set_parse_hex (std::vector< int > col_indices)
 
void 设置要作为十六进制解析的列索引。 更多...
 set_dtypes (std::map< std::string, data_type > types)
 
void 设置每列的数据类型。 更多...
 set_dtypes (std::vector< data_type > types)
 
void 设置每列的数据类型。 更多...
 set_true_values (std::vector< std::string > vals)
 
void 设置要识别为布尔真值的附加值。 更多...
 set_false_values (std::vector< std::string > vals)
 
void 设置要识别为布尔假值的附加值。 更多...
 set_na_values (std::vector< std::string > vals)
 
void 设置要识别为空值的附加值。 更多...
 enable_keep_default_na (bool val)
 
void 设置是否保留内置的默认 NA 值。 更多...
 enable_na_filter (bool val)
 
void 设置是否禁用空值过滤。 更多...
 enable_dayfirst (bool val)
 
void 设置是否将日期解析为 DD/MM 而非 MM/DD。 更多...
 set_timestamp_type (data_type type)
 

设置 timestamp_type,所有时间戳列都将转换为此类型。 更多...

静态公共成员函数static csv_reader_options_builder 
 builder (source_info src)
 

创建一个 csv_reader_options_builder,用于构建 csv_reader_options更多...

详细描述

用于 read_csv() 的设置。

定义在文件 csv.hpp50 行。

构造函数和析构函数文档

◆ csv_reader_options() ( )
cudf::io::csv_reader_options::csv_reader_options

默认

默认构造函数。

添加此构造函数是因为 Cython 需要一个默认构造函数来在栈上创建对象。

成员函数文档

◆ builder() ( static csv_reader_options_builder cudf::io::csv_reader_options::builder source_info )
src

static

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
source_info 参数
用于读取 CSV 文件的源信息
返回值

用于构建读取器选项的 Builder

◆ enable_dayfirst() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

inline

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

布尔值,用于启用/禁用

定义在文件 csv.hpp831 行。

◆ enable_delim_whitespace() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_delim_whitespace

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否将空白字符视为字段分隔符。

定义在文件 csv.hpp668 行。

◆ enable_detect_whitespace_around_quotes() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_detect_whitespace_around_quotes

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否检测被空格包围的引用,例如 "data"。当 _doublequote 为 true 时,此标志无效。

定义在文件 csv.hpp721 行。

◆ enable_doublequote() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_doublequote

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置值内部的引用是否被双重引用。

定义在文件 csv.hpp713 行。

◆ enable_keep_default_na() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_keep_default_na

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否保留内置的默认 NA 值。

定义在文件 csv.hpp813 行。

◆ enable_mangle_dupe_cols() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_mangle_dupe_cols

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否重命名重复的列名。

定义在文件 csv.hpp544 行。

◆ enable_na_filter() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_na_filter

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否禁用空值过滤。

定义在文件 csv.hpp820 行。

◆ enable_skip_blank_lines() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_skip_blank_lines

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否忽略空行或将行值解析为无效。

定义在文件 csv.hpp682 行。

◆ enable_skipinitialspace() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_skipinitialspace

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否跳过分隔符后的空白字符。

定义在文件 csv.hpp675 行。

◆ enable_windowslinetermination() ( bool  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::enable_windowslinetermination

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置是否将日期解析为 DD/MM 而非 MM/DD。

设置是否将 \r\n 视为行终止符。

定义在文件 csv.hpp661 行。

◆ get_byte_range_offset() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

const

用于读取 CSV 文件的源信息
返回从源开始跳过的字节数。

从源开始跳过的字节数

定义在文件 csv.hpp183 行。

◆ get_byte_range_padding() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::size_t cudf::io::csv_reader_options::get_byte_range_padding

用于读取 CSV 文件的源信息
返回读取时要填充的字节数。

读取时要填充的字节数

定义在文件 csv.hpp211 行。

◆ get_byte_range_size() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::size_t cudf::io::csv_reader_options::get_byte_range_size

用于读取 CSV 文件的源信息
返回要读取的字节数。

要读取的字节数

定义在文件 csv.hpp190 行。

◆ get_byte_range_size_with_padding() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::size_t cudf::io::csv_reader_options::get_byte_range_size_with_padding

用于读取 CSV 文件的源信息
返回带填充的要读取的字节数。

带填充的要读取的字节数

定义在文件 csv.hpp197 行。

◆ get_comment() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

char cudf::io::csv_reader_options::get_comment

用于读取 CSV 文件的源信息
返回注释行起始字符。

注释行起始字符

定义在文件 csv.hpp329 行。

◆ get_compression() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

compression_type cudf::io::csv_reader_options::get_compression

用于读取 CSV 文件的源信息
返回源的压缩格式。

源的压缩格式

定义在文件 csv.hpp176 行。

◆ get_decimal() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

char cudf::io::csv_reader_options::get_decimal

用于读取 CSV 文件的源信息
返回小数点字符。

小数点字符

定义在文件 csv.hpp322 行。

◆ get_delimiter() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

char cudf::io::csv_reader_options::get_delimiter

用于读取 CSV 文件的源信息
返回字段分隔符。

字段分隔符

定义在文件 csv.hpp308 行。

◆ get_dtypes() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::variant<std::vector<data_type>, std::map<std::string, data_type> > const& cudf::io::csv_reader_options::get_dtypes

用于读取 CSV 文件的源信息
返回每列的数据类型。

每列的数据类型

定义在文件 csv.hpp434 行。

◆ get_false_values() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_false_values

用于读取 CSV 文件的源信息
返回要识别为布尔假值的附加值。

要识别为布尔假值的附加值

定义在文件 csv.hpp451 行。

◆ get_header() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

size_type cudf::io::csv_reader_options::get_header

用于读取 CSV 文件的源信息
返回标题行索引。

标题行索引

定义在文件 csv.hpp294 行。

◆ get_lineterminator() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

char cudf::io::csv_reader_options::get_lineterminator

用于读取 CSV 文件的源信息
返回行终止符。

行终止符

定义在文件 csv.hpp301 行。

◆ get_na_values() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_na_values

用于读取 CSV 文件的源信息
返回要识别为空值的附加值。

要识别为空值的附加值

定义在文件 csv.hpp458 行。

◆ get_names() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_names

用于读取 CSV 文件的源信息
返回列名。

列名

定义在文件 csv.hpp235 行。

◆ get_nrows() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

size_type cudf::io::csv_reader_options::get_nrows

用于读取 CSV 文件的源信息
返回要读取的行数。

要读取的行数

定义在文件 csv.hpp273 行。

◆ get_parse_dates_indexes() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<int> const& cudf::io::csv_reader_options::get_parse_dates_indexes

用于读取 CSV 文件的源信息
返回要作为 datetime 读取的列索引。

要作为 datetime 读取的列索引

定义在文件 csv.hpp406 行。

◆ get_parse_dates_names() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_parse_dates_names

用于读取 CSV 文件的源信息
返回要作为 datetime 读取的列名。

要作为 datetime 读取的列名

定义在文件 csv.hpp396 行。

◆ get_parse_hex_indexes() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<int> const& cudf::io::csv_reader_options::get_parse_hex_indexes

用于读取 CSV 文件的源信息
返回要作为十六进制读取的列索引。

要作为十六进制读取的列索引

定义在文件 csv.hpp426 行。

◆ get_parse_hex_names() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_parse_hex_names

用于读取 CSV 文件的源信息
返回要作为十六进制读取的列名。

要作为十六进制读取的列名

定义在文件 csv.hpp416 行。

◆ get_prefix() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::string cudf::io::csv_reader_options::get_prefix

用于读取 CSV 文件的源信息
返回用于列 ID 的前缀。

用于列 ID 的前缀

定义在文件 csv.hpp242 行。

◆ get_quotechar() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

char cudf::io::csv_reader_options::get_quotechar

用于读取 CSV 文件的源信息
返回引用字符。

引用字符

定义在文件 csv.hpp371 行。

◆ get_quoting() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

quote_style cudf::io::csv_reader_options::get_quoting

用于读取 CSV 文件的源信息
返回引用样式。

引用样式

定义在文件 csv.hpp364 行。

◆ get_skipfooter() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

size_type cudf::io::csv_reader_options::get_skipfooter

用于读取 CSV 文件的源信息
返回从尾跳过的行数。

从尾跳过的行数

定义在文件 csv.hpp287 行。

◆ get_skiprows() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

size_type cudf::io::csv_reader_options::get_skiprows

用于读取 CSV 文件的源信息
返回从头跳过的行数。

从头跳过的行数

定义在文件 csv.hpp280 行。

◆ get_source() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

source_info const& cudf::io::csv_reader_options::get_source

用于读取 CSV 文件的源信息
返回源信息。

源信息

定义在文件 csv.hpp169 行。

◆ get_thousands() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

char cudf::io::csv_reader_options::get_thousands

用于读取 CSV 文件的源信息
返回数字数据千位分隔符。

数字数据千位分隔符

定义在文件 csv.hpp315 行。

◆ get_timestamp_type() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

data_type cudf::io::csv_reader_options::get_timestamp_type

用于读取 CSV 文件的源信息
返回 timestamp_type,所有时间戳列都将转换为此类型。

timestamp_type,所有时间戳列都将转换为此类型

定义在文件 csv.hpp486 行。

◆ get_true_values() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_true_values

用于读取 CSV 文件的源信息
返回要识别为布尔真值的附加值。

要识别为布尔真值的附加值

定义在文件 csv.hpp444 行。

◆ get_use_cols_indexes() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<int> const& cudf::io::csv_reader_options::get_use_cols_indexes

用于读取 CSV 文件的源信息
返回要读取的列索引。

要读取的列索引

定义在文件 csv.hpp266 行。

◆ get_use_cols_names() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

std::vector<std::string> const& cudf::io::csv_reader_options::get_use_cols_names

用于读取 CSV 文件的源信息
返回要读取的列名。

要读取的列名

定义在文件 csv.hpp256 行。

◆ is_enabled_dayfirst() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_dayfirst

用于读取 CSV 文件的源信息
是否将日期解析为 DD/MM 而非 MM/DD。

如果将日期解析为 DD/MM 则为 true,否则为 false (MM/DD)

定义在文件 csv.hpp479 行。

◆ is_enabled_delim_whitespace() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_delim_whitespace

用于读取 CSV 文件的源信息
是否将空白字符视为字段分隔符。

如果将空白字符视为字段分隔符则为 true

定义在文件 csv.hpp343 行。

◆ is_enabled_detect_whitespace_around_quotes() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_detect_whitespace_around_quotes

用于读取 CSV 文件的源信息
是否检测被空格包围的引用,例如 "data"。当 _doublequote 为 true 时,此标志无效。

如果 detect_whitespace_around_quotes 已启用则为 true

定义在文件 csv.hpp386 行。

◆ is_enabled_doublequote() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_doublequote

用于读取 CSV 文件的源信息
值内部的引用是否被双重引用。

如果值内部的引用被双重引用则为 true

定义在文件 csv.hpp378 行。

◆ is_enabled_keep_default_na() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_keep_default_na

用于读取 CSV 文件的源信息
是否保留内置的默认 NA 值。

如果保留内置的默认 NA 值则为 true

定义在文件 csv.hpp465 行。

◆ is_enabled_mangle_dupe_cols() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_mangle_dupe_cols

用于读取 CSV 文件的源信息
是否重命名重复的列名。

如果重命名重复的列名则为 true

定义在文件 csv.hpp249 行。

◆ is_enabled_na_filter() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_na_filter

用于读取 CSV 文件的源信息
是否禁用空值过滤。

如果启用空值过滤则为 true

定义在文件 csv.hpp472 行。

◆ is_enabled_skip_blank_lines() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_skip_blank_lines

用于读取 CSV 文件的源信息
是否忽略空行或将行值解析为无效。

如果忽略空行或将行值解析为无效则为 true

定义在文件 csv.hpp357 行。

◆ is_enabled_skipinitialspace() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_skipinitialspace

用于读取 CSV 文件的源信息
是否跳过分隔符后的空白字符。

如果跳过分隔符后的空白字符则为 true

定义在文件 csv.hpp350 行。

◆ is_enabled_windowslinetermination() ( ) std::size_t cudf::io::csv_reader_options::get_byte_range_offset
val

bool cudf::io::csv_reader_options::is_enabled_windowslinetermination

用于读取 CSV 文件的源信息
是否将 \r\n 视为行终止符。

如果将 \r\n 视为行终止符则为 true

定义在文件 csv.hpp336 行。

◆ set_byte_range_offset() ( std::size_t  void cudf::io::csv_reader_options::set_byte_range_offset)
val

offset

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_byte_range_offset设置从源开始跳过的字节数。

偏移的字节数

定义在文件 csv.hpp500 行。

◆ set_byte_range_size() ( std::size_t  void cudf::io::csv_reader_options::set_byte_range_size)
val

size

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_byte_range_size返回要读取的字节数。

设置要读取的字节数。

定义在文件 csv.hpp515 行。

◆ set_comment() ( char  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::set_comment

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置注释行起始字符。

表示注释的字符

定义在文件 csv.hpp654 行。

◆ set_compression() ( compression_type  void cudf::io::csv_reader_options::set_compression)
val

comp

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_compression设置源的压缩格式。

压缩类型

定义在文件 csv.hpp493 行。

◆ set_decimal() ( char  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::set_decimal

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置小数点字符。

表示小数的字符

定义在文件 csv.hpp647 行。

◆ set_delimiter() ( char  void cudf::io::csv_reader_options::set_delimiter)
val

delim

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_delimiter设置字段分隔符。

表示分隔符的字符

定义在文件 csv.hpp633 行。

◆ set_dtypes() [1/2] ( void cudf::io::csv_reader_options::set_dtypes std::map< std::string, data_type)
val

types

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::map< std::string, data_type设置每列的数据类型。

列名 -> 数据类型映射,指定列的目标数据类型

定义在文件 csv.hpp765 行。

◆ set_dtypes() [1/2] ( ◆ set_dtypes() [2/2] std::map< std::string, data_type)
val

types

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::map< std::string, data_typestd::vector< data_type

表示列目标数据类型的向量

定义在文件 csv.hpp772 行。

◆ set_false_values() ( void cudf::io::csv_reader_options::set_false_values std::vector< std::string > )
val

vals

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::vector< std::string > 设置要识别为布尔假值的附加值。

要被视为 false 的值向量

定义在文件 csv.hpp789 行。

◆ set_header() ( size_type  void cudf::io::csv_reader_options::set_header)
val

hdr

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_header设置标题行索引。

标题行所在的索引

定义在文件 csv.hpp619 行。

◆ set_lineterminator() ( char  void cudf::io::csv_reader_options::set_lineterminator)
val

term

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_lineterminator设置行终止符。

表示行终止的字符

定义在文件 csv.hpp626 行。

◆ set_na_values() ( void cudf::io::csv_reader_options::set_false_values std::vector< std::string > )
val

void cudf::io::csv_reader_options::set_na_values

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::vector< std::string > 设置要识别为空值的附加值。

要被视为 null 的值向量

定义在文件 csv.hpp799 行。

◆ set_names() ( void cudf::io::csv_reader_options::set_false_values void cudf::io::csv_reader_options::set_names)
val

col_names

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_names设置列名。

列名的向量

定义在文件 csv.hpp530 行。

◆ set_nrows() ( size_type  void cudf::io::csv_reader_options::set_nrows)
val

nrows

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_nrows返回要读取的行数。

设置要读取的行数。

定义在文件 csv.hpp571 行。

◆ set_parse_dates() [1/2] ( void cudf::io::csv_reader_options::set_parse_dates std::vector< int > )
val

col_indices

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::vector< int > 设置要作为 datetime 读取的列索引。

要推断为 datetime 的列索引向量

定义在文件 csv.hpp738 行。

◆ set_parse_dates() [1/2] ( void cudf::io::csv_reader_options::set_false_values void cudf::io::csv_reader_options::set_names)
val

◆ set_parse_dates() [2/2]

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_names设置要作为 datetime 读取的列名。

要推断为 datetime 的列名向量

定义在文件 csv.hpp728 行。

◆ set_parse_hex() [1/2] ( void cudf::io::csv_reader_options::set_parse_dates std::vector< int > )
val

void cudf::io::csv_reader_options::set_parse_hex

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::vector< int > 设置要作为十六进制解析的列索引。

要解析为十六进制的列索引向量

定义在文件 csv.hpp758 行。

◆ set_parse_hex() [1/2] ( void cudf::io::csv_reader_options::set_false_values void cudf::io::csv_reader_options::set_names)
val

◆ set_parse_hex() [2/2]

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_names设置要作为十六进制解析的列名。

要解析为十六进制的列名向量

定义在文件 csv.hpp748 行。

◆ set_prefix() ( std::string  void cudf::io::csv_reader_options::set_prefix)
val

pfx

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_prefix设置用于列 ID 的前缀。

用于每个列名的前缀字符串

定义在文件 csv.hpp537 行。

◆ set_quotechar() ( char  void cudf::io::csv_reader_options::set_quotechar)
val

ch

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_quotechar设置引用字符。

表示引用的字符

定义在文件 csv.hpp706 行。

◆ set_quoting() ( quote_style  void cudf::io::csv_reader_options::set_quoting)
val

quoting

设置输入 CSV 数据中使用的预期引用样式。

  1. 注意:仅支持以下引用样式
  2. MINIMAL:包含特殊字符(如行分隔符/字段分隔符/引号)的字符串列将被引用。
创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_quotingNONE:不对任何列进行引用。

使用的引用样式

定义在文件 csv.hpp694 行。

◆ set_skipfooter() ( size_type  void cudf::io::csv_reader_options::set_skipfooter)
val

skipfooter

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_skipfooter设置从尾跳过的行数。

要跳过的行数

定义在文件 csv.hpp601 行。

◆ set_skiprows() ( size_type  void cudf::io::csv_reader_options::set_skiprows)
val

skiprows

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_skiprows设置从尾跳过的行数。

设置从头跳过的行数。

定义在文件 csv.hpp587 行。

◆ set_thousands() ( char  void cudf::io::csv_reader_options::enable_dayfirst)
val

void cudf::io::csv_reader_options::set_thousands

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::enable_dayfirst设置数字数据千位分隔符。

分隔千位的字符

定义在文件 csv.hpp640 行。

◆ set_timestamp_type() ( data_type  void cudf::io::csv_reader_options::set_timestamp_type)
val

type

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_timestamp_type设置 timestamp_type,所有时间戳列都将转换为此类型。

所有时间戳列将转换为的目标 Dtype

定义在文件 csv.hpp838 行。

◆ set_true_values() ( void cudf::io::csv_reader_options::set_false_values std::vector< std::string > )
val

void cudf::io::csv_reader_options::set_true_values

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::vector< std::string > 设置要识别为布尔真值的附加值。

要被视为 true 的值向量

定义在文件 csv.hpp779 行。

◆ set_use_cols_indexes() ( void cudf::io::csv_reader_options::set_parse_dates std::vector< int > )
val

void cudf::io::csv_reader_options::set_use_cols_indexes

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
std::vector< int > 设置要读取的列索引。

所需的列索引向量

定义在文件 csv.hpp561 行。

◆ set_use_cols_names() ( void cudf::io::csv_reader_options::set_false_values void cudf::io::csv_reader_options::set_names)
val

void cudf::io::csv_reader_options::set_use_cols_names

创建一个 csv_reader_options_builder,用于构建 csv_reader_options
void cudf::io::csv_reader_options::set_names设置要读取的列名。

所需的列名向量


定义在文件 csv.hpp551 行。