公共成员函数 | 所有成员列表
cudf::distinct_hash_join 类参考

独特哈希连接(Distinct hash join),在创建时构建哈希表,并在随后的 `*_join` 成员函数中探测结果。 更多...

#include <join.hpp>

公共成员函数

 distinct_hash_join (distinct_hash_join const &)=delete
 
 distinct_hash_join (distinct_hash_join &&)=delete
 
distinct_hash_joinoperator= (distinct_hash_join const &)=delete
 
distinct_hash_joinoperator= (distinct_hash_join &&)=delete
 
 distinct_hash_join (cudf::table_view const &build, null_equality compare_nulls=null_equality::EQUAL, rmm::cuda_stream_view stream=cudf::get_default_stream())
 构造一个独特哈希连接对象,用于后续的探测调用。 更多...
 
std::pair< std::unique_ptr< rmm::device_uvector< size_type > >, std::unique_ptr< rmm::device_uvector< size_type > > > inner_join (cudf::table_view const &probe, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref()) const
 返回可用于构建两个表(通过内连接)连接结果的行索引。 更多...
 
std::unique_ptr< rmm::device_uvector< size_type > > left_join (cudf::table_view const &probe, rmm::cuda_stream_view stream=cudf::get_default_stream(), rmm::device_async_resource_ref mr=cudf::get_current_device_resource_ref()) const
 返回可用于构建两个表(通过左连接)连接结果的构建表索引。 更多...
 

详细描述

独特哈希连接(Distinct hash join),在创建时构建哈希表,并在随后的 `*_join` 成员函数中探测结果。

此类实现了独特哈希连接方案,即一次构建哈希表,然后根据需要多次(可能并行)进行探测。

注意
如果构建表包含重复项,则行为未定义。
所有 NaNs(非数字)被视为相等

定义于文件 join.hpp 的第 477 行。

构造函数与析构函数文档

◆ distinct_hash_join()

cudf::distinct_hash_join::distinct_hash_join ( cudf::table_view const &  build,
null_equality  compare_nulls = null_equality::EQUAL,
rmm::cuda_stream_view  stream = cudf::get_default_stream() 
)

构造一个独特哈希连接对象,用于后续的探测调用。

参数
build包含唯一元素的构建表
compare_nulls控制空值连接键是否匹配
stream用于设备内存操作和核函数启动的 CUDA 流

成员函数文档

◆ inner_join()

std::pair<std::unique_ptr<rmm::device_uvector<size_type> >, std::unique_ptr<rmm::device_uvector<size_type> > > cudf::distinct_hash_join::inner_join ( cudf::table_view const &  probe,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
) const

返回可用于构建两个表(通过内连接)连接结果的行索引。

另请参阅
cudf::inner_join().
参数
probe探测表,从中探测键
stream用于设备内存操作和核函数启动的 CUDA 流
mr用于分配返回索引的设备内存的设备内存资源。
返回值
一对列 [`probe_indices`, `build_indices`],可用于构建以 `build` 和 `probe` 作为连接键的两个表进行内连接的结果。

◆ left_join()

std::unique_ptr<rmm::device_uvector<size_type> > cudf::distinct_hash_join::left_join ( cudf::table_view const &  probe,
rmm::cuda_stream_view  stream = cudf::get_default_stream(),
rmm::device_async_resource_ref  mr = cudf::get_current_device_resource_ref() 
) const

返回可用于构建两个表(通过左连接)连接结果的构建表索引。

注意
对于探测表的给定行索引 `i`,结果 `build_indices[i]` 如果存在匹配,则包含构建表中匹配行的行索引。否则,包含 `JoinNoneValue`。
参数
probe探测表,从中探测键
stream用于设备内存操作和核函数启动的 CUDA 流
mr用于分配返回的表和列的设备内存的设备内存资源。
返回值
一个 `build_indices` 列,可用于构建以 `build` 和 `probe` 作为连接键的两个表进行左连接的结果。

本类的文档生成自以下文件