JSON#

class pylibcudf.io.json.JsonReaderOptions#

用于 read_json 的设置

详情请参阅 :cpp:class:`cudf::io::json_reader_options

方法

allow_nonnumeric_numbers(self, bool val)

allow_numeric_leading_zeros(self, bool val)

allow_unquoted_control_chars(self, bool val)

builder(SourceInfo source)

创建一个 JsonReaderOptionsBuilder 对象

enable_dayfirst(self, bool val)

enable_experimental(self, bool val)

enable_keep_quotes(self, bool keep_quotes)

设置读取器是否应保留字符串值的引号。

enable_lines(self, bool val)

设置是否按行读取文件作为 JSON 对象。

enable_mixed_types_as_string(self, ...)

设置是否将混合类型解析为字符串列。

enable_normalize_single_quotes(self, bool val)

enable_normalize_whitespace(self, bool val)

enable_prune_columns(self, bool prune_columns)

设置是否在读取时修剪列,根据 set_dtypes 选项选择。

set_byte_range_offset(self, size_t offset)

设置从源开头跳过的字节数。

set_byte_range_size(self, size_t size)

设置要读取的字节数。

set_delimiter(self, unicode val)

set_dtypes(self, list types)

设置要读取列的数据类型。

set_na_values(self, list vals)

set_strict_validation(self, bool val)

allow_nonnumeric_numbers(self, bool val) void#
allow_numeric_leading_zeros(self, bool val) void#
allow_unquoted_control_chars(self, bool val) void#
static builder(SourceInfo source)#

创建一个 JsonReaderOptionsBuilder 对象

详情请参阅 cudf::io::json_reader_options::builder()

参数:
sinkSourceInfo

读取 JSON 文件的源。

返回:
JsonReaderOptionsBuilder

构建 JsonReaderOptions 的构建器

enable_dayfirst(self, bool val) void#
enable_experimental(self, bool val) void#
enable_keep_quotes(self, bool keep_quotes) void#

设置读取器是否应保留字符串值的引号。

参数:
keep_quotesbool

布尔值,指示读取器是否应保留字符串值的引号

返回:
enable_lines(self, bool val) void#

设置是否按行读取文件作为 JSON 对象。

参数:
valbool

布尔值,用于启用/禁用将每行作为 JSON 对象读取的选项

返回:
enable_mixed_types_as_string(self, bool mixed_types_as_string) void#

设置是否将混合类型解析为字符串列。也启用使用 schema 强制将结构体读取为字符串列。

参数:
mixed_types_as_stringbool

布尔值,用于启用/禁用将混合类型解析为字符串列

返回:
enable_normalize_single_quotes(self, bool val) void#
enable_normalize_whitespace(self, bool val) void#
enable_prune_columns(self, bool prune_columns) void#

设置是否在读取时修剪列,根据 set_dtypes 选项选择。

参数:
prune_columnsbool

设置为 true 时,如果读取器选项包含 set_dtypes,则读取器将仅返回 set_dtypes 中提及的那些列。如果为 false,则返回所有列,无论 set_dtypes 设置如何。

返回:
set_byte_range_offset(self, size_t offset) void#

设置从源开头跳过的字节数。

参数:
offsetsize_t

偏移字节数

返回:
set_byte_range_size(self, size_t size) void#

设置要读取的字节数。

参数:
sizesize_t

要读取的字节数

返回:
set_delimiter(self, unicode val) void#
set_dtypes(self, list types) void#

设置要读取列的数据类型。

参数:
typeslist

数据类型列表或列名、数据类型和元组列表的元组列表(用于支持嵌套列层次结构)

返回:
set_na_values(self, list vals) void#
set_strict_validation(self, bool val) void#
class pylibcudf.io.json.JsonWriterOptions#

用于 write_json 的设置

详情请参阅 cudf::io::json_writer_options

方法

builder(SinkInfo sink, Table table)

创建一个 JsonWriterOptionsBuilder 对象

set_compression(self, compression_type comptype)

设置要使用的压缩类型

set_false_value(self, unicode val)

设置用于值 == 0 的字符串

set_rows_per_chunk(self, size_type val)

设置用于空条目的字符串。

set_true_value(self, unicode val)

设置用于值 != 0 的字符串

static builder(SinkInfo sink, Table table)#

创建一个 JsonWriterOptionsBuilder 对象

参数:
sinkSinkInfo

用于写入器输出的 sink

tableTable

要写入输出的表格

返回:
JsonWriterOptionsBuilder

构建 JsonWriterOptions 的构建器

set_compression(self, compression_type comptype) void#

设置要使用的压缩类型

参数:
comptypeCompressionType

sink 的压缩类型

返回:
set_false_value(self, unicode val) void#

设置用于值 == 0 的字符串

参数:
valstr

表示值 == 0 的字符串

返回:
set_rows_per_chunk(self, size_type val) void#

设置用于空条目的字符串。

参数:
valsize_type

表示空值的字符串

返回:
set_true_value(self, unicode val) void#

设置用于值 != 0 的字符串

参数:
valstr

表示值 != 0 的字符串

返回:
pylibcudf.io.json.chunked_read_json(JsonReaderOptions options, int chunk_size=100000000, Stream stream=None) tuple#

将 JSON 文件分块读取到 TableWithMetadata 中。

参数:
optionsJsonReaderOptions

控制读取行为的设置

chunk_sizeint,默认值 100_000_000 字节。

分块读取的字节数。 chunk_size 应至少设置为 row_size。

stream: Stream

用于设备内存操作和内核启动的 CUDA stream

返回:
tuple

一个元组 (columns, column_name, child_names)

pylibcudf.io.json.read_json(JsonReaderOptions options, Stream stream=None) TableWithMetadata#

从 JSON 格式读取。

要读取的源和选项由 options 对象封装。

详情请参阅 read_json()

参数:
options: JsonReaderOptions

控制读取行为的设置

stream: Stream

用于设备内存操作和内核启动的 CUDA stream

返回:
TableWithMetadata

读取到的表格及其相应的元数据(列名)。

pylibcudf.io.json.write_json(JsonWriterOptions options, Stream stream=None) void#

将一组列写入 JSON 格式。

参数:
optionsJsonWriterOptions

控制写入行为的设置

stream: Stream

用于设备内存操作和内核启动的 CUDA stream

返回: