18 #include <rmm/detail/export.hpp>
25 #include <shared_mutex>
28 namespace RMM_NAMESPACE {
57 template <
typename Upstream>
61 std::shared_lock<std::shared_mutex>;
63 std::unique_lock<std::shared_mutex>;
82 peak = std::max(value, peak);
111 peak = std::max(value + val.
peak, peak);
166 return counter_stack_.top().first;
180 return counter_stack_.top().second;
193 auto ret = counter_stack_.top();
208 if (counter_stack_.size() < 2) {
throw std::out_of_range(
"cannot pop the last counter pair"); }
209 auto ret = counter_stack_.top();
210 counter_stack_.pop();
212 counter_stack_.top().first.add_counters_from_tracked_sub_block(ret.first);
213 counter_stack_.top().second.add_counters_from_tracked_sub_block(ret.second);
233 void* ptr = get_upstream_resource().allocate_async(bytes, stream);
237 write_lock_t lock(mtx_);
240 counter_stack_.top().first += bytes;
241 counter_stack_.top().second += 1;
254 void do_deallocate(
void* ptr, std::size_t bytes, cuda_stream_view stream)
override
256 get_upstream_resource().deallocate_async(ptr, bytes, stream);
259 write_lock_t lock(mtx_);
262 counter_stack_.top().first -= bytes;
263 counter_stack_.top().second -= 1;
274 bool do_is_equal(device_memory_resource
const& other)
const noexcept
override
276 if (
this == &other) {
return true; }
277 auto cast =
dynamic_cast<statistics_resource_adaptor<Upstream> const*
>(&other);
278 if (cast ==
nullptr) {
return false; }
279 return get_upstream_resource() == cast->get_upstream_resource();
284 std::stack<std::pair<counter, counter>> counter_stack_{{std::make_pair(counter{}, counter{})}};
285 std::shared_mutex
mutable mtx_;
一个强类型的非拥有型 CUDA 流包装器,带有默认构造函数。
定义: cuda_stream_view.hpp:39
所有 librmm 设备内存分配的基类。
定义: device_memory_resource.hpp:92
使用 Upstream 分配内存并跟踪内存分配统计信息的资源。
定义: statistics_resource_adaptor.hpp:58
statistics_resource_adaptor(device_async_resource_ref upstream)
使用 upstream 构造新的统计信息资源适配器,以满足分配请求。
定义: statistics_resource_adaptor.hpp:123
statistics_resource_adaptor(statistics_resource_adaptor &&) noexcept=default
默认移动构造函数。
std::pair< counter, counter > push_counters()
在栈上压入一对零计数器,这将成为 get_bytes_count... 返回的新计数器
定义: statistics_resource_adaptor.hpp:190
std::unique_lock< std::shared_mutex > write_lock_t
用于同步写入访问的锁类型。
定义: statistics_resource_adaptor.hpp:63
statistics_resource_adaptor(Upstream *upstream)
使用 upstream 构造新的统计信息资源适配器,以满足分配请求。
定义: statistics_resource_adaptor.hpp:133
std::shared_lock< std::shared_mutex > read_lock_t
用于同步读取访问的锁类型。
定义: statistics_resource_adaptor.hpp:61
std::pair< counter, counter > pop_counters()
从栈中弹出一对计数器。
定义: statistics_resource_adaptor.hpp:205
counter get_allocations_counter() const noexcept
返回此适配器的计数器结构,其中包含当前、峰值和总计分配数量...
定义: statistics_resource_adaptor.hpp:176
counter get_bytes_counter() const noexcept
返回此适配器的计数器结构,其中包含当前、峰值和总计已分配数量...
定义: statistics_resource_adaptor.hpp:162
cuda::mr::async_resource_ref< cuda::mr::device_accessible > device_async_resource_ref
cuda::mr::async_resource_ref 的别名,具有 cuda::mr::device_accessible 属性。
定义: resource_ref.hpp:40
device_async_resource_ref to_device_async_resource_ref_checked(Resource *res)
将内存资源指针转换为 device_async_resource_ref,并检查是否为 nullptr
定义: resource_ref.hpp:78
每设备 device_memory_resource 的管理。
用于计数数值当前、峰值和总计值的实用结构体。
定义: statistics_resource_adaptor.hpp:67
counter & operator-=(int64_t val)
从当前值中减去 val,并在必要时更新峰值。
定义: statistics_resource_adaptor.hpp:92
int64_t value
当前值。
定义: statistics_resource_adaptor.hpp:68
int64_t peak
值的最大值
定义: statistics_resource_adaptor.hpp:69
void add_counters_from_tracked_sub_block(const counter &val)
将 val 添加到当前值,并在必要时更新峰值。
定义: statistics_resource_adaptor.hpp:109
counter & operator+=(int64_t val)
将 val 添加到当前值,并在必要时更新峰值。
定义: statistics_resource_adaptor.hpp:78
int64_t total
所有已添加值的总和。
定义: statistics_resource_adaptor.hpp:70