公共属性 | 所有成员列表
cudf::io::table_metadata 结构体参考

IO 读取器返回的表元数据。 更多...

#include <types.hpp>

公共属性

std::vector< column_name_infoschema_info
 整个输出层次结构的详细名称信息。
 
std::vector< size_t > num_rows_per_source
 
std::map< std::string, std::string > user_data
 
std::vector< std::unordered_map< std::string, std::string > > per_file_user_data
 每文件依赖于格式的元数据,以键值对形式存储。
 
size_type num_input_row_groups {0}
 所有数据源的总输入行组数。
 
std::optional< size_typenum_row_groups_after_stats_filter
 
std::optional< size_typenum_row_groups_after_bloom_filter
 

详细描述

IO 读取器返回的表元数据。

定义于文件 io/types.hpp277 行。

成员数据文档

◆ num_row_groups_after_bloom_filter

std::optional<size_type> cudf::io::table_metadata::num_row_groups_after_bloom_filter

布隆过滤器处理后剩余的行组数量。如果未进行过滤,则为 std::nullopt。目前仅由 Parquet 读取器报告。

定义于文件 io/types.hpp295 行。

◆ num_row_groups_after_stats_filter

std::optional<size_type> cudf::io::table_metadata::num_row_groups_after_stats_filter

统计过滤器处理后剩余的行组数量。如果未进行过滤,则为 std::nullopt。目前仅由 Parquet 读取器报告。

定义于文件 io/types.hpp291 行。

◆ num_rows_per_source

std::vector<size_t> cudf::io::table_metadata::num_rows_per_source

从每个数据源读取的行数。目前仅在未使用 AST 过滤器时为 Parquet 读取器计算。否则为空向量。

定义于文件 io/types.hpp280 行。

◆ user_data

std::map<std::string, std::string> cudf::io::table_metadata::user_data

第一个输入文件的依赖于格式的元数据,以键值对形式存储(已弃用)

定义于文件 io/types.hpp283 行。


此结构体的文档生成自以下文件