JSON#
- class pylibcudf.io.json.JsonReaderOptions#
用于
read_json
的设置详情请参阅 :cpp:class:`cudf::io::json_reader_options
方法
allow_nonnumeric_numbers
(self, bool val)allow_numeric_leading_zeros
(self, bool val)allow_unquoted_control_chars
(self, bool val)builder
(SourceInfo source)创建一个 JsonReaderOptionsBuilder 对象
enable_dayfirst
(self, bool val)enable_experimental
(self, bool val)enable_keep_quotes
(self, bool keep_quotes)设置读取器是否应保留字符串值的引号。
enable_lines
(self, bool val)设置是否按行读取文件作为 JSON 对象。
enable_mixed_types_as_string
(self, ...)设置是否将混合类型解析为字符串列。
enable_normalize_single_quotes
(self, bool val)enable_normalize_whitespace
(self, bool val)enable_prune_columns
(self, bool prune_columns)设置是否在读取时修剪列,根据
set_dtypes
选项选择。set_byte_range_offset
(self, size_t offset)设置从源开头跳过的字节数。
set_byte_range_size
(self, size_t size)设置要读取的字节数。
set_delimiter
(self, unicode val)set_dtypes
(self, list types)设置要读取列的数据类型。
set_na_values
(self, list vals)set_strict_validation
(self, bool val)- allow_nonnumeric_numbers(self, bool val) void #
- allow_numeric_leading_zeros(self, bool val) void #
- allow_unquoted_control_chars(self, bool val) void #
- static builder(SourceInfo source)#
创建一个 JsonReaderOptionsBuilder 对象
详情请参阅
cudf::io::json_reader_options::builder()
- 参数:
- sinkSourceInfo
读取 JSON 文件的源。
- 返回:
- JsonReaderOptionsBuilder
构建 JsonReaderOptions 的构建器
- enable_dayfirst(self, bool val) void #
- enable_experimental(self, bool val) void #
- enable_keep_quotes(self, bool keep_quotes) void #
设置读取器是否应保留字符串值的引号。
- 参数:
- keep_quotesbool
布尔值,指示读取器是否应保留字符串值的引号
- 返回:
- 无
- enable_lines(self, bool val) void #
设置是否按行读取文件作为 JSON 对象。
- 参数:
- valbool
布尔值,用于启用/禁用将每行作为 JSON 对象读取的选项
- 返回:
- 无
- enable_mixed_types_as_string(self, bool mixed_types_as_string) void #
设置是否将混合类型解析为字符串列。也启用使用 schema 强制将结构体读取为字符串列。
- 参数:
- mixed_types_as_stringbool
布尔值,用于启用/禁用将混合类型解析为字符串列
- 返回:
- 无
- enable_normalize_single_quotes(self, bool val) void #
- enable_normalize_whitespace(self, bool val) void #
- enable_prune_columns(self, bool prune_columns) void #
设置是否在读取时修剪列,根据
set_dtypes
选项选择。- 参数:
- prune_columnsbool
设置为 true 时,如果读取器选项包含
set_dtypes
,则读取器将仅返回set_dtypes
中提及的那些列。如果为 false,则返回所有列,无论set_dtypes
设置如何。
- 返回:
- 无
- set_byte_range_offset(self, size_t offset) void #
设置从源开头跳过的字节数。
- 参数:
- offsetsize_t
偏移字节数
- 返回:
- 无
- set_byte_range_size(self, size_t size) void #
设置要读取的字节数。
- 参数:
- sizesize_t
要读取的字节数
- 返回:
- 无
- set_delimiter(self, unicode val) void #
- set_dtypes(self, list types) void #
设置要读取列的数据类型。
- 参数:
- typeslist
数据类型列表或列名、数据类型和元组列表的元组列表(用于支持嵌套列层次结构)
- 返回:
- 无
- set_na_values(self, list vals) void #
- set_strict_validation(self, bool val) void #
- class pylibcudf.io.json.JsonWriterOptions#
用于
write_json
的设置详情请参阅
cudf::io::json_writer_options
方法
builder
(SinkInfo sink, Table table)创建一个 JsonWriterOptionsBuilder 对象
set_compression
(self, compression_type comptype)设置要使用的压缩类型
set_false_value
(self, unicode val)设置用于值 == 0 的字符串
set_rows_per_chunk
(self, size_type val)设置用于空条目的字符串。
set_true_value
(self, unicode val)设置用于值 != 0 的字符串
- static builder(SinkInfo sink, Table table)#
创建一个 JsonWriterOptionsBuilder 对象
- 参数:
- sinkSinkInfo
用于写入器输出的 sink
- tableTable
要写入输出的表格
- 返回:
- JsonWriterOptionsBuilder
构建 JsonWriterOptions 的构建器
- set_compression(self, compression_type comptype) void #
设置要使用的压缩类型
- 参数:
- comptypeCompressionType
sink 的压缩类型
- 返回:
- 无
- set_false_value(self, unicode val) void #
设置用于值 == 0 的字符串
- 参数:
- valstr
表示值 == 0 的字符串
- 返回:
- 无
- set_rows_per_chunk(self, size_type val) void #
设置用于空条目的字符串。
- 参数:
- valsize_type
表示空值的字符串
- 返回:
- 无
- set_true_value(self, unicode val) void #
设置用于值 != 0 的字符串
- 参数:
- valstr
表示值 != 0 的字符串
- 返回:
- 无
- pylibcudf.io.json.chunked_read_json(JsonReaderOptions options, int chunk_size=100000000, Stream stream=None) tuple #
将 JSON 文件分块读取到
TableWithMetadata
中。- 参数:
- optionsJsonReaderOptions
控制读取行为的设置
- chunk_sizeint,默认值 100_000_000 字节。
分块读取的字节数。 chunk_size 应至少设置为 row_size。
- stream: Stream
用于设备内存操作和内核启动的 CUDA stream
- 返回:
- tuple
一个元组 (columns, column_name, child_names)
- pylibcudf.io.json.read_json(JsonReaderOptions options, Stream stream=None) TableWithMetadata #
从 JSON 格式读取。
要读取的源和选项由 options 对象封装。
详情请参阅
read_json()
。- 参数:
- options: JsonReaderOptions
控制读取行为的设置
- stream: Stream
用于设备内存操作和内核启动的 CUDA stream
- 返回:
- TableWithMetadata
读取到的表格及其相应的元数据(列名)。
- pylibcudf.io.json.write_json(JsonWriterOptions options, Stream stream=None) void #
将一组列写入 JSON 格式。
- 参数:
- optionsJsonWriterOptions
控制写入行为的设置
- stream: Stream
用于设备内存操作和内核启动的 CUDA stream
- 返回:
- 无