public class ColumnView extends Object implements AutoCloseable, BinaryOperable
修饰符和类型 | 类和描述 |
---|---|
静态类 |
ColumnView.FindOptions
用于选择 listIndexOf 函数行为的枚举:1.
|
修饰符和类型 | 字段和描述 |
---|---|
protected long |
nullCount |
protected ColumnVector.OffHeapState |
offHeap |
protected long |
rows |
protected DType |
type |
静态 long |
UNKNOWN_NULL_COUNT |
protected long |
viewHandle |
修饰符 | 构造方法和描述 |
---|---|
protected |
ColumnView(ColumnVector.OffHeapState state)
旨在从 ColumnVector 构造时调用。
|
|
ColumnView(DType type, long rows, Optional<Long> nullCount, BaseDeviceMemoryBuffer dataBuffer, BaseDeviceMemoryBuffer validityBuffer)
根据设备上已有的数据创建新的列视图。
|
|
ColumnView(DType type, long rows, Optional<Long> nullCount, BaseDeviceMemoryBuffer dataBuffer, BaseDeviceMemoryBuffer validityBuffer, BaseDeviceMemoryBuffer offsetBuffer)
根据设备上已有的数据创建新的列视图。
|
|
ColumnView(DType type, long 行数, Optional<Long> null计数, BaseDeviceMemoryBuffer 有效性缓冲区, BaseDeviceMemoryBuffer 偏移量缓冲区, ColumnView[] 子列)
根据设备上已有的数据创建新的列视图。
|
修饰符和类型 | 方法和说明 |
---|---|
ColumnVector |
abs()
计算绝对值,输出类型与输入类型相同。
|
ColumnVector |
addCalendricalMonths(ColumnView months)
将指定数量的月添加到时间戳。
|
ColumnVector |
addCalendricalMonths(Scalar months)
将指定数量的月添加到时间戳。
|
Scalar |
all()
返回一个布尔标量,如果列中的所有元素都为真或非零则返回 true,否则返回 false。
|
Scalar |
all(DType outType)
已弃用。
唯一支持的输出类型是 BOOL8。
|
Scalar |
any()
返回一个布尔标量,如果列中的任何元素为真或非零则返回 true,否则返回 false。
|
Scalar |
any(DType outType)
返回一个标量,取决于指定类型,如果列中的任何元素为真或非零则返回 true 或 1,否则返回 false 或 0。
|
ColumnVector |
applyBooleanMask(ColumnView booleanMaskView)
使用 `booleanMaskView` 布尔值列表作为掩码,过滤此 LIST 列中每一行的元素。
|
ColumnVector |
approxPercentile(ColumnVector percentiles)
计算此 ColumnVector 的各种百分位数,该 ColumnVector 必须包含由 t-digest 聚合生成的质心。
|
ColumnVector |
approxPercentile(double[] percentiles)
计算此 ColumnVector 的各种百分位数,该 ColumnVector 必须包含由 t-digest 聚合生成的质心。
|
ColumnVector |
arccos()
计算 arccos,输出类型与输入类型相同。
|
ColumnVector |
arccosh()
计算双曲 arccos,输出类型与输入类型相同。
|
ColumnVector |
arcsin()
计算 arcsin,输出类型与输入类型相同。
|
ColumnVector |
arcsinh()
计算双曲 arcsin,输出类型与输入类型相同。
|
ColumnVector |
arctan()
计算 arctan,输出类型与输入类型相同。
|
ColumnVector |
arctanh()
计算双曲 arctan,输出类型与输入类型相同。
|
ColumnVector |
asByteList()
转换为字节列表 此方法转换 ColumnVector 提供的行,并将每行转换为字节列表,字节序反转。
|
ColumnVector |
asByteList(boolean config)
转换为字节列表 此方法转换 ColumnVector 提供的行,并将每行转换为字节列表。
|
ColumnVector |
asBytes()
转换为字节 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为字节。从 Date、Timestamp 或 Boolean 转换为字节类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asDoubles()
转换为双精度浮点数 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为双精度浮点数。从 Date、Timestamp 或 Boolean 转换为双精度浮点数类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asFloats()
转换为单精度浮点数 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为单精度浮点数。从 Date、Timestamp 或 Boolean 转换为单精度浮点数类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asInts()
转换为整型 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为整型。从 Date、Timestamp 或 Boolean 转换为整型类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asLongs()
转换为长整型 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为长整型。从 Date、Timestamp 或 Boolean 转换为长整型类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asShorts()
转换为短整型 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为短整型。从 Date、Timestamp 或 Boolean 转换为短整型类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asStrings()
转换为字符串。
|
ColumnVector |
asStrings(String format)
解析时间戳列向量并转换为字符串列向量的方法。
|
ColumnVector |
asTimestamp(DType timestampType, String format)
将字符串解析为时间戳。
|
ColumnVector |
asTimestampDays()
转换为 TIMESTAMP_DAYS - ColumnVector 此方法获取 ColumnVector 提供的值并转换为 TIMESTAMP_DAYS
|
ColumnVector |
asTimestampDays(String format)
转换为 TIMESTAMP_DAYS - ColumnVector 此方法获取 ColumnVector 提供的字符串值并转换为 TIMESTAMP_DAYS
|
ColumnVector |
asTimestampMicroseconds()
转换为 TIMESTAMP_MICROSECONDS - ColumnVector 此方法获取 ColumnVector 提供的值并转换为 TIMESTAMP_MICROSECONDS
|
ColumnVector |
asTimestampMicroseconds(String format)
转换为 TIMESTAMP_MICROSECONDS - ColumnVector 此方法获取 ColumnVector 提供的字符串值并转换为 TIMESTAMP_MICROSECONDS
|
ColumnVector |
asTimestampMilliseconds()
转换为 TIMESTAMP_MILLISECONDS - ColumnVector 此方法获取 ColumnVector 提供的值并转换为 TIMESTAMP_MILLISECONDS。
|
ColumnVector |
asTimestampMilliseconds(String format)
转换为 TIMESTAMP_MILLISECONDS - ColumnVector 此方法获取 ColumnVector 提供的字符串值并转换为 TIMESTAMP_MILLISECONDS。
|
ColumnVector |
asTimestampNanoseconds()
转换为 TIMESTAMP_NANOSECONDS - ColumnVector 此方法获取 ColumnVector 提供的值并转换为 TIMESTAMP_NANOSECONDS。
|
ColumnVector |
asTimestampNanoseconds(String format)
转换为 TIMESTAMP_NANOSECONDS - ColumnVector 此方法获取 ColumnVector 提供的字符串值并转换为 TIMESTAMP_NANOSECONDS。
|
ColumnVector |
asTimestampSeconds()
转换为 TIMESTAMP_SECONDS - ColumnVector 此方法获取 ColumnVector 提供的值并转换为 TIMESTAMP_SECONDS
|
ColumnVector |
asTimestampSeconds(String format)
转换为 TIMESTAMP_SECONDS - ColumnVector 此方法获取 ColumnVector 提供的字符串值并转换为 TIMESTAMP_SECONDS
|
ColumnVector |
asUnsignedBytes()
转换为无符号字节 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为字节。从 Date、Timestamp 或 Boolean 转换为字节类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asUnsignedInts()
转换为无符号整型 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为整型。从 Date、Timestamp 或 Boolean 转换为整型类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asUnsignedLongs()
转换为无符号长整型 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为长整型。从 Date、Timestamp 或 Boolean 转换为长整型类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
asUnsignedShorts()
转换为无符号短整型 - ColumnVector 此方法获取 ColumnVector 提供的值并转换为短整型。从 Date、Timestamp 或 Boolean 转换为短整型类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
binaryOp(BinaryOp op, BinaryOperable rhs, DType outType)
多种不同的二进制运算。
|
ColumnView |
bitCastTo(DType type)
在底层长度相同的类型之间进行零拷贝转换。
|
ColumnVector |
bitInvert()
按位取反,输出类型与输入类型相同。
|
ColumnVector |
capitalize(Scalar delimiters)
返回一个字符串列,其中字符串已被首字母大写。
|
ColumnVector |
castTo(DType type)
将 ColumnVector 进行类型转换的通用方法。从 Date、Timestamp 或 Boolean 转换为数值类型时,将使用数据的底层数值表示进行转换。
|
ColumnVector |
cbrt()
计算立方根,输出类型与输入类型相同。
|
ColumnVector |
ceil()
计算向上取整,输出类型与输入类型相同。
|
ColumnVector |
clamp(Scalar lo, Scalar hi)
将 `input` 中小于 `lo` 的值替换为 `lo`,将大于 `hi` 的值替换为 `hi`。
|
ColumnVector |
clamp(Scalar lo, Scalar loReplace, Scalar hi, Scalar hiReplace)
将 `input` 中小于 `lo` 的值替换为 `lo_replace`,将大于 `hi` 的值替换为 `hi_replace`。
|
void |
close() |
ColumnVector |
codePoints()
获取每个字符串中每个字符的代码点值(整数)。
|
ColumnVector |
contains(ColumnView searchSpace)
返回一个
DType.BOOL8 类型的新列,其大小与此列相同,如果此列中的对应条目包含在给定的 searchSpace 列中,则每行的值为 true,否则为 false。 |
boolean |
contains(Scalar needle)
查找 `needle` 是否在此列中存在。示例:单列:idx 0 1 2 3 4 col = { 10, 20, 20, 30, 50 } 标量:value = { 20 } 结果 = true
|
ColumnVector |
containsRe(RegexProgram regexProg)
返回一个布尔 ColumnVector,识别匹配给定 RegexProgram 模式(从任意位置开始)的行。
|
ColumnVector |
containsRe(String pattern)
已弃用。
|
ColumnVector |
copyToColumnVector()
从列视图句柄创建一个 ColumnVector
|
HostColumnVector |
copyToHost()
同步将数据复制到主机内存
|
HostColumnVector |
copyToHost(HostMemoryAllocator hostMemoryAllocator)
同步将数据复制到主机。
|
HostColumnVector |
copyToHostAsync(Cuda.Stream stream)
异步将数据复制到主机。
|
HostColumnVector |
copyToHostAsync(Cuda.Stream stream, HostMemoryAllocator hostMemoryAllocator)
异步将数据复制到主机。
|
ColumnVector |
cos()
计算 cos,输出类型与输入类型相同。
|
ColumnVector |
cosh()
计算双曲 cos,输出类型与输入类型相同。
|
ColumnVector |
countElements()
获取每个列表中元素的数量。
|
ColumnVector |
dateTimeCeil(DateTimeRoundingFrequency freq)
将时间戳向上舍入到给定频率,保持类型不变。
|
ColumnVector |
dateTimeFloor(DateTimeRoundingFrequency freq)
将时间戳向下舍入到给定频率,保持类型不变。
|
ColumnVector |
dateTimeRound(DateTimeRoundingFrequency freq)
将时间戳(四舍五入)舍入到给定频率,保持类型不变。
|
ColumnVector |
day()
从时间戳中获取日期。
|
ColumnVector |
dayOfYear()
从时间戳中获取一年中的第几天。
|
ColumnVector |
daysInMonth()
提取月份中的天数
|
int |
distinctCount()
计算列中有多少行互不相同(去重计数)。
|
int |
distinctCount(NullPolicy nullPolicy)
计算列中有多少行互不相同(去重计数)。
|
ColumnVector |
dropListDuplicates()
通过从当前 LIST 列复制元素并忽略重复项来创建新的 LIST 列,生成的 LIST 列中的每个列表只包含唯一元素。
|
ColumnVector |
dropListDuplicatesWithKeysValues()
给定一个 LIST 列,其中每个元素都是一个包含以下内容的结构体:
|
ColumnVector |
endsWith(Scalar pattern)
检查列中的每个字符串是否以指定的比较字符串结尾,结果是一个并行的布尔结果列。
|
ColumnVector |
exp()
计算 exp (指数函数),输出类型与输入类型相同。
|
ColumnVector |
extractAllRecord(RegexProgram regexProg, int idx)
提取所有匹配给定正则表达式程序模式并对应于正则表达式组索引的字符串。
|
ColumnVector |
extractAllRecord(String pattern, int idx)
已弃用。
|
ColumnVector |
extractDateTimeComponent(DateTimeComponent component)
从时间戳中提取特定的日期时间组件。
|
ColumnVector |
extractListElement(ColumnView indices)
对于此列中的每个列表,提取索引列中指定的对应索引处的条目。
|
ColumnVector |
extractListElement(int index)
对于此列中的每个列表,提取给定索引处的条目。
|
Table |
extractRe(RegexProgram regexProg)
对于给定正则表达式程序中指定的每个捕获组,在表中返回一个列。
|
Table |
extractRe(String pattern)
已弃用。
|
ColumnVector |
findAndReplaceAll(ColumnView oldValues, ColumnView newValues)
返回一个向量,其中所有值 "oldValues[i]" 被替换为 "newValues[i]"。
|
ColumnVector |
flattenLists()
将列表的列表展平为一个单独的列表。
|
ColumnVector |
flattenLists(boolean ignoreNull)
将列表的列表展平为一个单独的列表。
|
ColumnVector |
floor()
计算向下取整,输出类型与输入类型相同。
|
static ColumnView |
fromDeviceBuffer(BaseDeviceMemoryBuffer buffer, long startOffset, DType type, int rows)
从原始设备缓冲区创建一个新的列视图。
|
ColumnVector |
generateListOffsets()
根据每个列表的大小生成列表偏移量。
|
ColumnVector |
getByteCount()
检索每个字符串的字节数。
|
ColumnVector |
getCharLengths()
检索每个字符串中的字符数。
|
ColumnView |
getChildColumnView(int childIndex)
返回给定索引处的子列视图。
|
ColumnView[] |
getChildColumnViews()
返回此视图的子列视图。请注意,调用者有责任关闭这些视图。
|
BaseDeviceMemoryBuffer |
getData()
获取当前列视图 (viewHandle) 的数据缓冲区。
|
long |
getDeviceMemorySize()
返回使用的设备内存量。
|
long |
getHostBytesRequired()
计算将数据复制到主机所需的总空间。
|
ColumnVector |
getJSONObject(Scalar path)
将 JSONPath 字符串应用于输入字符串列中的所有行。
|
ColumnVector |
getJSONObject(Scalar path, GetJsonObjectOptions options)
将 JSONPath 字符串应用于输入字符串列中的所有行。
|
ColumnView |
getListOffsetsView()
获取此列表的偏移量的 ColumnView。
|
ColumnVector |
getMapKeyExistence(ColumnView keys)
对于 List 类型的列
|
ColumnVector |
getMapKeyExistence(Scalar key)
对于 List 类型的列
|
ColumnVector |
getMapValue(ColumnView keys)
给定一个 List 类型的列
|
ColumnVector |
getMapValue(Scalar key)
给定一个 List 类型的列
|
long |
getNativeView()
谨慎使用:此方法暴露了原生 cudf::column_view 的地址。
|
long |
getNullCount()
返回数据中的空值数量。
|
int |
getNumChildren() |
BaseDeviceMemoryBuffer |
getOffsets() |
long |
getRowCount()
返回此向量中的行数。
|
Scalar |
getScalarElement(int index)
将指定索引处列中的单个项作为 Scalar 获取。
|
DType |
getType()
获取此数据的类型。
|
BaseDeviceMemoryBuffer |
getValid() |
boolean |
hasNonEmptyNulls()
精确检查列或其后代是否包含非空 null 行
|
静态 long |
hostPaddingSizeInBytes()
获取主机用于对齐内存分配的大小(字节)。
|
ColumnVector |
hour()
从具有时间分辨率的时间戳中获取小时。
|
ColumnVector |
ifElse(ColumnView trueValues, ColumnView falseValues)
对于 BOOL8 向量,基于此向量在相应行中的布尔值,计算一个其行从其他两个向量中选择的向量。
|
ColumnVector |
ifElse(ColumnView trueValues, Scalar falseValue)
对于 BOOL8 向量,基于此向量在相应行中的布尔值,计算一个其行从其他两个输入中选择的向量。
|
ColumnVector |
ifElse(Scalar trueValue, ColumnView falseValues)
对于 BOOL8 向量,基于此向量在相应行中的布尔值,计算一个其行从其他两个输入中选择的向量。
|
ColumnVector |
ifElse(Scalar trueValue, Scalar falseValue)
对于 BOOL8 向量,基于此向量在相应行中的布尔值,计算一个其行从其他两个输入中选择的向量。
|
ColumnVector |
isFixedPoint(DType decimalType)
返回一个与此实例行数相同的布尔向量,对于定点数条目为 TRUE,否则为 FALSE。
|
ColumnVector |
isFloat()
返回一个与此实例行数相同的布尔向量,对于浮点数条目为 TRUE,否则为 FALSE。
|
ColumnVector |
isInteger()
返回一个与此实例行数相同的布尔向量,对于整数条目为 TRUE,否则为 FALSE。
|
ColumnVector |
isInteger(DType intType)
返回一个与此实例行数相同的布尔向量,对于整数条目为 TRUE,否则为 FALSE。
|
ColumnVector |
isLeapYear()
检查此时间戳的年份是否为闰年。
|
ColumnVector |
isNan()
返回一个与此实例行数相同的布尔向量,对于 NaN 条目为 TRUE,如果为 null 或有效浮点值为 FALSE。
|
ColumnVector |
isNotNan()
返回一个与此实例行数相同的布尔向量,对于 null 或有效浮点数值为 TRUE,否则为 FALSE。
|
ColumnVector |
isNotNull()
返回一个与此实例行数相同的布尔向量,对于非 null 条目为 TRUE,对于 null 条目为 FALSE(根据有效性掩码)。
|
ColumnVector |
isNull()
返回一个与此实例行数相同的布尔向量,对于非 null 条目为 FALSE,对于 null 条目为 TRUE(根据有效性掩码)。
|
ColumnVector |
isTimestamp(String format)
验证字符串列是否可以使用提供的格式模式解析为时间戳。
|
ColumnVector |
joinStrings(Scalar separator, Scalar narep)
将列中的所有字符串连接成一个新字符串,可选地由分隔符字符串分隔。
|
ColumnVector |
lastDayOfMonth()
获取此时间戳所在月份的最后一天日期。
|
ColumnVector |
like(Scalar pattern, Scalar escapeChar)
返回一个布尔 ColumnVector,用于标识与给定 like 模式匹配的行。
|
ColumnVector |
listContains(Scalar key)
创建一个布尔值列,指示指定的标量是否是列表列每行的元素。
|
ColumnVector |
listContainsColumn(ColumnView key)
创建一个布尔值列,指示第一列的列表行是否包含第二列中的相应值。
|
ColumnVector |
listContainsNulls()
创建一个布尔值列,指示指定列的列表行是否包含 null 元素。
|
ColumnVector |
listIndexOf(ColumnView keys, ColumnView.FindOptions findOption)
创建一个 int32 索引列,指示搜索键列中每行在列表列相应行中的位置。
|
ColumnVector |
listIndexOf(Scalar key, ColumnView.FindOptions findOption)
创建一个 int32 索引列,指示标量搜索键在每个列表行中的位置。
|
ColumnVector |
listReduce(SegmentedReductionAggregation aggregation)
对列表中的值执行归约。
|
ColumnVector |
listReduce(SegmentedReductionAggregation aggregation, DType outType)
对列表中的值执行归约。
|
ColumnVector |
listReduce(SegmentedReductionAggregation aggregation, NullPolicy nullPolicy, DType outType)
对列表中的值执行归约。
|
static ColumnVector |
listsDifferenceDistinct(ColumnView lhs, ColumnView rhs)
查找左列列表与右列列表的差集。
|
static ColumnVector |
listsHaveOverlap(ColumnView lhs, ColumnView rhs)
对于输入列表列中的每对列表,检查它们是否有任何共同的非空元素。
|
static ColumnVector |
listsIntersectDistinct(ColumnView lhs, ColumnView rhs)
查找给定列表列每行列表中不含重复项的交集。
|
ColumnVector |
listSortRows(boolean isDescending, boolean isNullSmallest)
对列表列中每行列表内的元素进行分段排序。
|
static ColumnVector |
listsUnionDistinct(ColumnView lhs, ColumnView rhs)
查找给定列表列每行列表中不含重复项的并集。
|
ColumnVector |
log()
计算对数,输出类型与输入类型相同。
|
ColumnVector |
log10()
计算以 10 为底的对数,输出类型与输入类型相同。
|
ColumnVector |
log2()
计算以 2 为底的对数,输出类型与输入类型相同。
|
ColumnView |
logicalCastTo(DType type)
已弃用。
在 C++ 中这已改为 bit_cast,因此请改用该名称。
|
ColumnVector |
lower()
将字符串转换为小写。
|
ColumnVector |
lstrip()
移除字符串开头的空白字符。
|
ColumnVector |
lstrip(Scalar toStrip)
移除每个字符串开头指定的字符。
|
static ColumnView |
makeStructView(ColumnView... columns)
创建现有列视图的新结构体列视图。
|
static ColumnView |
makeStructView(long rows, ColumnView... columns)
创建现有列视图的新结构体列视图。
|
ColumnVector |
matchesRe(RegexProgram regexProg)
返回一个布尔 ColumnVector,用于标识与给定 regex program 模式匹配但仅在字符串开头的行。
|
ColumnVector |
matchesRe(String pattern)
已弃用。
|
Scalar |
max()
返回列中所有值的最大值,返回与此列相同类型的标量。
|
Scalar |
max(DType outType)
已弃用。
max 归约不再内部允许设置输出类型,作为替代,此 API 会为您将输入类型转换为输出类型,但这可能并非适用于所有情况。
|
Scalar |
mean()
返回列中所有值的算术平均值,返回 FLOAT64 标量,除非列类型为 FLOAT32,此时返回 FLOAT32 标量。
|
Scalar |
mean(DType outType)
返回列中所有值的算术平均值,返回指定类型的标量。
|
ColumnVector |
mergeAndSetValidity(BinaryOp mergeOp, ColumnView... columns)
创建列的深拷贝,同时替换 null 掩码。
|
Scalar |
min()
返回列中所有值的最小值,返回与此列相同类型的标量。
|
Scalar |
min(DType outType)
已弃用。
min 归约不再内部允许设置输出类型,作为替代,此 API 会为您将输入类型转换为输出类型,但这可能并非适用于所有情况。
|
ColumnVector |
minute()
从具有时间分辨率的时间戳中获取分钟。
|
ColumnVector |
month()
从时间戳中获取月份。
|
ColumnVector |
nansToNulls()
返回一个新 ColumnVector,其中 NaN 已转换为 null,并保留现有 null 值。
|
ColumnVector |
normalizeNANsAndZeros()
创建“标准化”值的新向量,其中:1.
|
ColumnVector |
not()
返回输入列(this)中每个值的逻辑 `not` 向量。
|
ColumnVector |
pad(int width)
在右侧使用空格“ ”填充字符串列,直到达到所需长度。
|
ColumnVector |
pad(int width, PadSide side)
使用空格“ ”填充字符串列,直到达到所需长度。
|
ColumnVector |
pad(int width, PadSide side, String fillChar)
填充字符串列,直到达到所需长度。
|
ColumnVector |
prefixSum()
计算此列中值的累加和(也称为前缀和)。
|
Scalar |
product()
返回列中所有值的乘积,返回与此列相同类型的标量。
|
Scalar |
product(DType outType)
返回列中所有值的乘积,返回指定类型的标量。
|
ColumnVector |
purgeNonEmptyNulls()
将此列复制到输出列,同时清除列或其后代中的任何非空 null 行。
|
ColumnVector |
quantile(QuantileMethod method, double[] quantiles)
计算此 ColumnVector 的各种分位数。
|
ColumnVector |
quarterOfYear()
从时间戳中获取季度。
|
Scalar |
reduce(ReductionAggregation aggregation)
计算列中所有行值的归约。
|
Scalar |
reduce(ReductionAggregation aggregation, DType outType)
计算列中所有行值的归约。
|
ColumnVector |
repeatStrings(ColumnView repeatTimes)
给定一个字符串列,通过将输入字符串重复由
repeatTimes 数字列中相应行给定的次数来生成输出字符串列。 |
ColumnVector |
repeatStrings(int repeatTimes)
给定一个字符串列,其中的每个字符串都会被重复由
repeatTimes 参数指定的次数。 |
ColumnView |
replaceChildrenWithViews(int[] indices, ColumnView[] views)
此方法接受嵌套类型并将其子项替换为给定的视图。注意:确保叶节点中的行数与替换它的子项相同,否则列表可能指向列值之外的元素。
|
ColumnView |
replaceListChild(ColumnView child)
此方法接受一个列表并返回一个新列表,其中叶节点已被给定的视图替换。
|
ColumnVector |
replaceMultiRegex(String[] patterns, ColumnView repls)
对于每个字符串,将匹配任何正则表达式模式的任何字符序列替换为相应的替换字符串。
|
ColumnVector |
replaceNulls(ColumnView replacements)
返回一个 ColumnVector,其中所有 null 值都被指定替换列中的相应行替换。
|
ColumnVector |
replaceNulls(ReplacePolicy policy) |
ColumnVector |
replaceNulls(Scalar scalar)
返回一个 ColumnVector,其中所有 null 值都替换为标量。
|
ColumnVector |
replaceRegex(RegexProgram regexProg, Scalar repl)
对于每个字符串,使用替换字符串标量替换匹配给定 regex program 模式的任何字符序列。
|
ColumnVector |
replaceRegex(RegexProgram regexProg, Scalar repl, int maxRepl)
对于每个字符串,使用替换字符串标量替换匹配给定 regex program 模式的任何字符序列。
|
ColumnVector |
replaceRegex(String pattern, Scalar repl)
已弃用。
|
ColumnVector |
replaceRegex(String pattern, Scalar repl, int maxRepl)
已弃用。
|
ColumnVector |
reverseStringsOrLists()
将当前列复制到新列,输出列中的每个字符串或列表将具有反向字符或元素顺序。
|
ColumnVector |
rint()
将浮点参数四舍五入到最接近的整数值,但以浮点数形式返回。
|
ColumnVector |
rollingWindow(RollingAggregation op, WindowOptions options)
此函数聚合输入列中每个元素 i 周围窗口中的值。
|
ColumnVector |
round()
使用这些默认值四舍五入列中的所有值: decimalPlaces = 0 Rounding method = RoundMode.HALF_UP
|
ColumnVector |
round(int decimalPlaces)
使用 HALF_UP(默认)作为四舍五入方法,将列中的所有值四舍五入到指定的小数位数。
|
ColumnVector |
round(int decimalPlaces, RoundMode mode)
将列中的所有值四舍五入到指定的小数位数。
|
ColumnVector |
round(RoundMode round)
将列中的所有值四舍五入到小数点后 0 位。
|
ColumnVector |
rstrip()
移除字符串末尾的空白字符。
|
ColumnVector |
rstrip(Scalar toStrip)
移除每个字符串末尾指定的字符。
|
ColumnVector |
scan(ScanAggregation aggregation)
计算排除 null 的列的包含扫描。
|
ColumnVector |
scan(ScanAggregation aggregation, ScanType scanType)
计算排除 null 的列的扫描。
|
ColumnVector |
scan(ScanAggregation aggregation, ScanType scanType, NullPolicy nullPolicy)
计算列的扫描。
|
ColumnVector |
second()
从具有时间分辨率的时间戳中获取秒。
|
ColumnVector |
segmentedGather(ColumnView gatherMap)
分段收集列表列中每行列表元素内的元素。
|
ColumnVector |
segmentedGather(ColumnView gatherMap, OutOfBoundsPolicy policy)
分段收集列表列中每行列表元素内的元素。
|
ColumnVector |
segmentedReduce(ColumnView offsets, SegmentedReductionAggregation aggregation)
执行分段归约,其中 offsets 列指示要合并的 this 中的组。
|
ColumnVector |
segmentedReduce(ColumnView offsets, SegmentedReductionAggregation aggregation, DType outType)
执行分段归约,其中 offsets 列指示要合并的 this 中的组。
|
ColumnVector |
segmentedReduce(ColumnView offsets, SegmentedReductionAggregation aggregation, NullPolicy nullPolicy, DType outType)
执行分段归约,其中 offsets 列指示要合并的 this 中的组。
|
ColumnVector |
sin()
计算 sin,输出类型与输入类型相同。
|
ColumnVector |
sinh()
计算双曲 sin,输出类型与输入类型相同。
|
ColumnVector[] |
slice(int... indices)
根据一组索引将列(包括 null 值)切片为一组列。
|
ColumnVector[] |
split(int... indices)
根据一组索引将列(包括 null 值)分割为一组列。
|
ColumnView[] |
splitAsViews(int... indices)
根据一组索引将 ColumnView(包括 null 值)分割为一组 ColumnViews。
|
ColumnVector |
sqrt()
计算平方根,输出类型与输入类型相同。
|
Scalar |
standardDeviation()
返回列中所有值的样本标准差,返回 FLOAT64 标量,除非列类型为 FLOAT32,此时返回 FLOAT32 标量。
|
Scalar |
standardDeviation(DType outType)
返回列中所有值的样本标准差,返回指定类型的标量。
|
ColumnVector |
startsWith(Scalar pattern)
检查列中的每个字符串是否以指定的比较字符串开头,生成一个布尔结果的并行列。
|
ColumnVector |
stringConcatenateListElements(ColumnView sepCol)
给定一个字符串列表列(每行是一个字符串列表),连接每行内的字符串并返回一个字符串列结果。
|
ColumnVector |
stringConcatenateListElements(ColumnView sepCol, Scalar separatorNarep, Scalar stringNarep, boolean separateNulls, boolean emptyStringOutputIfEmptyList)
给定一个字符串列表列(每行是一个字符串列表),连接每行内的字符串并返回一个字符串列结果。
|
ColumnVector |
stringConcatenateListElements(Scalar separator, Scalar narep, boolean separateNulls, boolean emptyStringOutputIfEmptyList)
给定一个字符串列表列(每行是一个字符串列表),连接每行内的字符串并返回一个字符串列结果。
|
ColumnVector[] |
stringContains(ColumnView targets) |
ColumnVector |
stringContains(Scalar compString)
检查列中的每个字符串是否包含指定的比较字符串,生成一个布尔结果的并行列。
|
ColumnVector |
stringLocate(Scalar substring)
定位给定字符串在列中每行第一个实例的起始索引。
|
ColumnVector |
stringLocate(Scalar substring, int start)
定位给定字符串在列中每行第一个实例的起始索引。
|
ColumnVector |
stringLocate(Scalar substring, int start, int end)
定位给定字符串在列中每行第一个实例的起始索引。
|
ColumnVector |
stringReplace(ColumnView targets, ColumnView repls)
返回一个新的字符串列,其中每个字符串中的目标字符串都被相应的替换字符串替换。
|
ColumnVector |
stringReplace(Scalar target, Scalar replace)
返回一个新的字符串列,其中每个字符串中的目标字符串都被指定的替换字符串替换。
|
ColumnVector |
stringReplaceWithBackrefs(RegexProgram regexProg, String replace)
对于每个字符串,使用反向引用替换模板替换匹配给定 regex program 模式的任何字符序列。
|
ColumnVector |
stringReplaceWithBackrefs(String pattern, String replace)
已弃用。
|
Table |
stringSplit(RegexProgram regexProg)
通过使用指定的 regex program 模式分割每个字符串来返回列的列表。
|
Table |
stringSplit(RegexProgram regexProg, int limit)
通过使用指定的 regex program 模式分割每个字符串来返回列的列表。
|
Table |
stringSplit(String delimiter)
通过使用指定的字符串字面量分隔符分割每个字符串来返回列的列表。
|
Table |
stringSplit(String pattern, boolean splitByRegex)
已弃用。
|
Table |
stringSplit(String delimiter, int limit)
通过使用指定的字符串字面量分隔符分割每个字符串来返回列的列表。
|
Table |
stringSplit(String pattern, int limit, boolean splitByRegex)
已弃用。
|
ColumnVector |
stringSplitRecord(RegexProgram regexProg)
返回一个列,其中每个列表都是通过使用指定的 regex program 模式分割相应输入字符串而生成的字符串列表。
|
ColumnVector |
stringSplitRecord(RegexProgram regexProg, int limit)
返回一个列,其中每个列表都是通过使用指定的 regex program 模式分割相应输入字符串而生成的字符串列表。
|
ColumnVector |
stringSplitRecord(String delimiter)
返回一个列,其中每个列表都是通过使用指定的字符串字面量分隔符分割相应输入字符串而生成的字符串列表。
|
ColumnVector |
stringSplitRecord(String pattern, boolean splitByRegex)
已弃用。
|
ColumnVector |
stringSplitRecord(String delimiter, int limit)
返回一个列,其中每个列表都是通过使用指定的字符串字面量分隔符分割相应输入字符串而生成的字符串列表。
|
ColumnVector |
stringSplitRecord(String pattern, int limit, boolean splitByRegex)
已弃用。
|
ColumnVector |
strip()
移除字符串开头和末尾的空白字符。
|
ColumnVector |
strip(Scalar toStrip)
移除每个字符串开头和末尾指定的字符。
|
ColumnVector |
substring(ColumnView start, ColumnView end)
返回一个新的字符串列,其中包含给定列中字符串的子字符串,对每个字符串使用唯一的范围。
|
ColumnVector |
substring(int start)
返回一个新的字符串列,其中包含给定列中字符串的子字符串。
|
ColumnVector |
substring(int start, int end)
返回一个新的字符串列,其中包含给定列中字符串的子字符串。
|
ColumnVector |
subVector(int start)
返回从 start(包含)到向量末尾的子向量。
|
ColumnVector |
subVector(int start, int end)
返回子向量。
|
Scalar |
sum()
计算列中所有值的总和,返回与此列相同类型的标量。
|
Scalar |
sum(DType outType)
计算列中所有值的总和,返回指定类型的标量。
|
Scalar |
sumOfSquares()
返回列中所有值的平方和,返回与此列相同类型的标量。
|
Scalar |
sumOfSquares(DType outType)
返回列中所有值的平方和,返回指定类型的标量。
|
ColumnVector |
tan()
计算 tan,输出类型与输入类型相同。
|
ColumnVector |
tanh()
计算双曲 tan,输出类型与输入类型相同。
|
protected static long |
title(long handle) |
ColumnVector |
toHex()
将此整数列转换为十六进制列并返回一个新的字符串列。任何 null 条目都将在输出列中生成相应的 null 条目。
|
String |
toString() |
ColumnVector |
toTitle()
返回一个字符串列,其中对于输入的每个字符串行,空格后的第一个字符被转换为大写,而单词中所有剩余字符被转换为小写。
|
ColumnVector |
transform(String udf, boolean isPtx)
使用自定义函数转换向量。
|
ColumnVector |
unaryOp(UnaryOp op)
多种不同的一元操作。输出类型与输入类型相同。
|
ColumnVector |
upper()
将字符串转换为大写。
|
ColumnVector |
urlDecode()
将所有以 '%' 开头的字符序列转换为字符代码点,将后面的两个字符解释为十六进制值以创建代码点。
|
ColumnVector |
urlEncode()
将大多数非 ASCII 字符和控制字符转换为以 '%' 为前缀的 UTF-8 十六进制代码点。
|
Scalar |
variance()
返回列中所有值的方差,返回 FLOAT64 标量,除非列类型为 FLOAT32,此时返回 FLOAT32 标量。
|
Scalar |
variance(DType outType)
返回列中所有值的方差,返回指定类型的标量。
|
ColumnVector |
weekDay()
从时间戳中获取星期几。
|
ColumnVector |
year()
从时间戳中获取年份。
|
ColumnVector |
zfill(int width)
在每个字符串左侧添加 '0' 作为填充。
|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, wait, wait, wait
add, add, and, and, arctan2, arctan2, bitAnd, bitAnd, bitOr, bitOr, bitXor, bitXor, div, div, equalTo, equalTo, equalToNullAware, equalToNullAware, floorDiv, floorDiv, greaterOrEqualTo, greaterOrEqualTo, greaterThan, greaterThan, implicitConversion, lessOrEqualTo, lessOrEqualTo, lessThan, lessThan, log, log, maxNullAware, maxNullAware, minNullAware, minNullAware, mod, mod, mul, mul, notEqualTo, notEqualTo, notEqualToNullAware, notEqualToNullAware, or, or, pmod, pmod, pow, pow, shiftLeft, shiftLeft, shiftRight, shiftRight, shiftRightUnsigned, shiftRightUnsigned, sub, sub, trueDiv, trueDiv
public static final long UNKNOWN_NULL_COUNT
protected long viewHandle
protected final DType type
protected final long rows
protected final long nullCount
protected final ColumnVector.OffHeapState offHeap
protected ColumnView(ColumnVector.OffHeapState state)
state
- 此视图基于的状态。AssertionError
- 如果 offHeapState 指向包含非空 null 的嵌套类型视图public ColumnView(DType type, long rows, Optional<Long> nullCount, BaseDeviceMemoryBuffer validityBuffer, BaseDeviceMemoryBuffer offsetBuffer, ColumnView[] children)
copyToColumnVector()
type
- 向量的类型rows
- 此向量中的行数。nullCount
- 数据集中的 null 数。validityBuffer
- 可选的有效性缓冲区。如果 nullCount != 0,则必须提供。此缓冲区的所有权不会更改。offsetBuffer
- 嵌套类型(包括字符串和字符串类别)所需的主机缓冲区。此缓冲区的所有权不会更改。children
- ColumnView 子项数组public ColumnView(DType type, long rows, Optional<Long> nullCount, BaseDeviceMemoryBuffer dataBuffer, BaseDeviceMemoryBuffer validityBuffer)
copyToColumnVector()
type
- 向量的类型rows
- 此向量中的行数。nullCount
- 数据集中的 null 数。dataBuffer
- 嵌套类型(包括字符串和字符串类别)所需的主机缓冲区。此缓冲区的所有权不会更改。validityBuffer
- 可选的有效性缓冲区。如果 nullCount != 0,则必须提供。此缓冲区的所有权不会更改。public ColumnView(DType type, long rows, Optional<Long> nullCount, BaseDeviceMemoryBuffer dataBuffer, BaseDeviceMemoryBuffer validityBuffer, BaseDeviceMemoryBuffer offsetBuffer)
copyToColumnVector()
type
- 向量的类型rows
- 此向量中的行数。nullCount
- 数据集中的 null 数。dataBuffer
- 嵌套类型(包括字符串和字符串类别)所需的主机缓冲区。此缓冲区的所有权不会更改。validityBuffer
- 可选的有效性缓冲区。如果 nullCount != 0,则必须提供。此缓冲区的所有权不会更改。offsetBuffer
- 需要偏移缓冲区的列的偏移缓冲区。public ColumnVector copyToColumnVector()
public final long getNativeView()
public final DType getType()
BinaryOperable
getType
in interface BinaryOperable
public final ColumnView[] getChildColumnViews()
public final ColumnView getChildColumnView(int childIndex)
childIndex
- 子索引public ColumnView getListOffsetsView()
public final BaseDeviceMemoryBuffer getData()
public final BaseDeviceMemoryBuffer getOffsets()
public final BaseDeviceMemoryBuffer getValid()
public long getNullCount()
public final long getRowCount()
public final int getNumChildren()
public long getDeviceMemorySize()
public void close()
close
in interface AutoCloseable
public final ColumnVector nansToNulls()
public final ColumnVector getCharLengths()
public final ColumnVector getByteCount()
public final ColumnVector codePoints()
public final ColumnVector countElements()
public final ColumnVector isNotNull()
public final ColumnVector isNull()
public final ColumnVector isFixedPoint(DType decimalType)
decimalType
- 用于边界检查的数据类型。请注意,只允许使用 Decimal 类型(定点)。public final ColumnVector isInteger()
public final ColumnVector isInteger(DType intType)
intType
- 用于边界检查的数据类型。请注意,只允许使用 cudf 整数类型,包括有符号/无符号 int8 到 int64。public final ColumnVector isFloat()
public final ColumnVector isNan()
public final ColumnVector isNotNan()
public final ColumnVector findAndReplaceAll(ColumnView oldValues, ColumnView newValues)
oldValues
- - 包含应替换的值的向量newValues
- - 包含新值的向量public final ColumnVector replaceNulls(Scalar scalar)
scalar
- - 用作替换的标量值。public final ColumnVector replaceNulls(ColumnView replacements)
replacements
- 替换值列public final ColumnVector replaceNulls(ReplacePolicy policy)
public final ColumnVector ifElse(ColumnView trueValues, ColumnView falseValues)
trueValues
- 如果此列中的行为 true,则选择的值falseValues
- 如果此列中的行为不 true,则选择的值public final ColumnVector ifElse(ColumnView trueValues, Scalar falseValue)
trueValues
- 如果此列中的行为 true,则选择的值falseValue
- 如果此列中的行为不 true,则选择的值public final ColumnVector ifElse(Scalar trueValue, ColumnView falseValues)
trueValue
- 如果此列中的行为 true,则选择的值falseValues
- 如果此列中的行为不 true,则选择的值public final ColumnVector ifElse(Scalar trueValue, Scalar falseValue)
trueValue
- 如果此列中的行为 true,则选择的值falseValue
- 如果此列中的行为不 true,则选择的值public final ColumnVector[] slice(int... indices)
indices
- public final ColumnVector subVector(int start)
start
- 起始索引(包含)。public final ColumnVector subVector(int start, int end)
start
- 起始索引(包含)。end
- 结束索引(不包含)。public final ColumnVector[] split(int... indices)
indices
- 用于分割的索引。public ColumnView[] splitAsViews(int... indices)
indices
- 用于分割的索引。public final ColumnVector normalizeNANsAndZeros()
Double.longBitsToDouble(long)
的文档描述了 NaN/-NaN 的等效值可能有不同的位表示。此方法可用于将 0.0 或 NaN 的不同位值比较为逻辑等效。例如,如果这些值出现在 groupby 键列中,如果没有标准化,0.0 和 -0.0 将被错误地视为不同的组,每个 NaN 的表示也是如此。public final ColumnVector mergeAndSetValidity(BinaryOp mergeOp, ColumnView... columns)
mergeOp
- 二元运算符(仅限 BITWISE_AND 和 BITWISE_OR)columns
- 其 null 掩码被合并的列数组,必须具有相同的行数。public final ColumnVector extractDateTimeComponent(DateTimeComponent component)
component
- 应提取的内容。public final ColumnVector year()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector month()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector day()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector hour()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector minute()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector second()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector weekDay()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector lastDayOfMonth()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector dayOfYear()
后置条件 - 分配了一个包含结果的新向量。调用者拥有该向量并负责其生命周期。
public final ColumnVector quarterOfYear()
public final ColumnVector addCalendricalMonths(ColumnView months)
months
- 必须是一个 INT16 列,表示要添加的月数。负数月也有效。public final ColumnVector addCalendricalMonths(Scalar months)
months
- 必须是一个 INT16 标量,表示要添加的月数。负数月也有效。public final ColumnVector isLeapYear()
public final ColumnVector daysInMonth()
public final ColumnVector dateTimeCeil(DateTimeRoundingFrequency freq)
freq
- 要舍入的时间戳部分。public final ColumnVector dateTimeFloor(DateTimeRoundingFrequency freq)
freq
- 要舍入的时间戳部分。public final ColumnVector dateTimeRound(DateTimeRoundingFrequency freq)
freq
- 要舍入的时间戳部分。public ColumnVector round(int decimalPlaces, RoundMode mode)
decimalPlaces
- 舍入到的小数位数。如果为负数,则指定小数点左侧的位数。mode
- 舍入方法(HALF_UP 或 HALF_EVEN)public ColumnVector round(RoundMode round)
round
- 舍入方法(HALF_UP 或 HALF_EVEN)public ColumnVector round(int decimalPlaces)
decimalPlaces
- 舍入到的小数位数。如果为负数,则指定小数点左侧的位数。public ColumnVector round()
public final ColumnVector transform(String udf, boolean isPtx)
udf
- 此函数将应用于向量中的每个元素。isPtx
- 函数代码是否为 ptx?true 表示 ptx,false 表示 C/C++。public final ColumnVector unaryOp(UnaryOp op)
op
- 要执行的操作。public final ColumnVector sin()
public final ColumnVector cos()
public final ColumnVector tan()
public final ColumnVector arcsin()
public final ColumnVector arccos()
public final ColumnVector arctan()
public final ColumnVector sinh()
public final ColumnVector cosh()
public final ColumnVector tanh()
public final ColumnVector arcsinh()
public final ColumnVector arccosh()
public final ColumnVector arctanh()
public final ColumnVector exp()
public final ColumnVector log()
public final ColumnVector log2()
public final ColumnVector log10()
public final ColumnVector sqrt()
public final ColumnVector cbrt()
public final ColumnVector ceil()
public final ColumnVector floor()
public final ColumnVector abs()
public final ColumnVector rint()
public final ColumnVector bitInvert()
public final ColumnVector binaryOp(BinaryOp op, BinaryOperable rhs, DType outType)
binaryOp
in interface BinaryOperable
op
- 要执行的操作。rhs
- 操作的右侧。outType
- 您想要的输出类型。public Scalar sum()
public Scalar min()
@Deprecated public Scalar min(DType outType)
public Scalar max()
@Deprecated public Scalar max(DType outType)
public Scalar product()
public Scalar sumOfSquares()
public Scalar mean()
public Scalar mean(DType outType)
outType
- 要返回的输出类型。请注意,目前仅支持浮点类型。public Scalar variance()
public Scalar variance(DType outType)
outType
- 要返回的输出类型。请注意,目前仅支持浮点类型。public Scalar standardDeviation()
public Scalar standardDeviation(DType outType)
outType
- 要返回的输出类型。请注意,目前仅支持浮点类型。public Scalar any()
public Scalar any(DType outType)
public Scalar all()
@Deprecated public Scalar all(DType outType)
public Scalar reduce(ReductionAggregation aggregation)
aggregation
- 要执行的归约聚合操作。Scalar.isValid()
方法将返回 false。public Scalar reduce(ReductionAggregation aggregation, DType outType)
aggregation
- 要执行的归约聚合操作。outType
- 要返回的标量值类型。并非所有聚合操作都支持所有输出类型。Scalar.isValid()
方法将返回 false。public ColumnVector segmentedReduce(ColumnView offsets, SegmentedReductionAggregation aggregation)
offsets
- 一个不含空值的 INT32 列。aggregation
- 要执行的聚合操作。public ColumnVector segmentedReduce(ColumnView offsets, SegmentedReductionAggregation aggregation, DType outType)
offsets
- 一个不含空值的 INT32 列。aggregation
- 要执行的聚合操作。outType
- 输出数据类型。public ColumnVector segmentedReduce(ColumnView offsets, SegmentedReductionAggregation aggregation, NullPolicy nullPolicy, DType outType)
offsets
- 一个不含空值的 INT32 列。aggregation
- 要执行的聚合操作。nullPolicy
- 空值策略。outType
- 输出数据类型。public ColumnVector segmentedGather(ColumnView gatherMap)
gatherMap
- ListColumnView,包含整数索引列表,用于将源列中每行列表中的元素映射到结果列中的列表行。public ColumnVector segmentedGather(ColumnView gatherMap, OutOfBoundsPolicy policy)
gatherMap
- ListColumnView,包含整数索引列表,用于将源列中每行列表中的元素映射到结果列中的列表行。policy
- OutOfBoundsPolicy,`DONT_CHECK` 会导致未定义行为;`NULLIFY` 会将越界替换为空值。public ColumnVector listReduce(SegmentedReductionAggregation aggregation)
aggregation
- 要执行的聚合操作。public ColumnVector listReduce(SegmentedReductionAggregation aggregation, DType outType)
aggregation
- 要执行的聚合操作。outType
- 输出类型。通常,这应该与列表的子类型匹配。public ColumnVector listReduce(SegmentedReductionAggregation aggregation, NullPolicy nullPolicy, DType outType)
aggregation
- 要执行的聚合操作。nullPolicy
- 聚合是否应包含空值。outType
- 输出类型。通常,这应该与列表的子类型匹配。public final ColumnVector approxPercentile(double[] percentiles)
percentiles
- 必需的百分位数 [0,1]public final ColumnVector approxPercentile(ColumnVector percentiles)
percentiles
- 包含百分位数 [0,1] 的列。public final ColumnVector quantile(QuantileMethod method, double[] quantiles)
method
- 用于计算分位数的方法。quantiles
- 分位数 [0,1] 的值。public final ColumnVector rollingWindow(RollingAggregation op, WindowOptions options)
op
- 要执行的操作。options
- 各种窗口函数参数。IllegalArgumentException
- 如果使用了不支持的窗口规范(即 WindowOptions.FrameType.ROWS
之外的规范)。public final ColumnVector prefixSum()
public final ColumnVector scan(ScanAggregation aggregation, ScanType scanType, NullPolicy nullPolicy)
aggregation
- 要执行的聚合操作。scanType
- 扫描应为包含式(包含当前行)还是排除式。nullPolicy
- 如何处理空值。请注意,一些聚合操作也包含空值策略。目前不支持这些聚合操作,因此它们如何相互作用是未定义的。public final ColumnVector scan(ScanAggregation aggregation, ScanType scanType)
aggregation
- 要执行的聚合操作。scanType
- 扫描应为包含式(包含当前行)还是排除式。public final ColumnVector scan(ScanAggregation aggregation)
aggregation
- 要执行的聚合操作。public final ColumnVector not()
public boolean contains(Scalar needle)
needle
- public final ColumnVector contains(ColumnView searchSpace)
DType.BOOL8
元素的新列,其大小与此列相同,如果此列中的对应条目包含在给定的 searchSpace 列中,则每行值为 true,否则为 false。调用者将负责新向量的生命周期。示例:col = { 10, 20, 30, 40, 50 } searchSpace = { 20, 40, 60, 80 } result = { false, true, false, true, false }searchSpace
- DType.BOOL8
的新 ColumnVector。public final ColumnVector toTitle()
public final ColumnVector capitalize(Scalar delimiters)
delimiters
- 用于标识要大写的单词。不应为空。public final ColumnVector joinStrings(Scalar separator, Scalar narep)
separator
- 要插入以分隔每一行的内容。narep
- 用于替换空值的内容。public ColumnVector castTo(DType type)
asTimestamp(DType, String)
和 asStrings(String)
,了解在格式已知的情况下如何将字符串转换为时间戳。浮点值转换为字符串后可能与 Java 中预期的默认行为不同,例如 12.3 => "12.30000019" 而不是 "12.3",Double.POSITIVE_INFINITY => "Inf" 而不是 "INFINITY",Double.NEGATIVE_INFINITY => "-Inf" 而不是 "-INFINITY"。type
- 结果 ColumnVector 的类型。public ColumnView replaceChildrenWithViews(int[] indices, ColumnView[] views)
public ColumnView replaceListChild(ColumnView child)
@Deprecated public ColumnView logicalCastTo(DType type)
type
- 要转换到的类型。public ColumnView bitCastTo(DType type)
type
- 要转换到的类型。public final ColumnVector asBytes()
public final ColumnVector asByteList()
public final ColumnVector asByteList(boolean config)
config
- 如果为 true,则翻转字节序;否则保留字节序。public final ColumnVector asUnsignedBytes()
Java 没有无符号字节类型,因此正确解码这些值需要应用程序进行额外步骤。请参阅 Byte.toUnsignedInt(byte)
。
public final ColumnVector asShorts()
public final ColumnVector asUnsignedShorts()
Java 没有无符号短整型,因此正确解码这些值需要应用程序进行额外步骤。请参阅 Short.toUnsignedInt(short)
。
public final ColumnVector asInts()
public final ColumnVector asUnsignedInts()
Java 没有无符号整型,因此正确解码这些值需要应用程序进行额外步骤。请参阅 Integer.toUnsignedLong(int)
。
public final ColumnVector asLongs()
public final ColumnVector asUnsignedLongs()
Java 没有无符号长整型,因此正确解码这些值需要应用程序进行额外步骤。请参阅 Long.toUnsignedString(long)
。
public final ColumnVector asFloats()
public final ColumnVector asDoubles()
public final ColumnVector asTimestampDays()
public final ColumnVector asTimestampDays(String format)
format
- 时间戳字符串格式说明符,如果列类型不是字符串,则忽略。public final ColumnVector asTimestampSeconds()
public final ColumnVector asTimestampSeconds(String format)
format
- 时间戳字符串格式说明符,如果列类型不是字符串,则忽略。public final ColumnVector asTimestampMicroseconds()
public final ColumnVector asTimestampMicroseconds(String format)
format
- 时间戳字符串格式说明符,如果列类型不是字符串,则忽略。public final ColumnVector asTimestampMilliseconds()
public final ColumnVector asTimestampMilliseconds(String format)
format
- 时间戳字符串格式说明符,如果列类型不是字符串,则忽略。public final ColumnVector asTimestampNanoseconds()
public final ColumnVector asTimestampNanoseconds(String format)
format
- 时间戳字符串格式说明符,如果列类型不是字符串,则忽略。public final ColumnVector asTimestamp(DType timestampType, String format)
timestampType
- 包含时间单位的时间戳 DType,用于将时间戳解析到其中。format
- 时间戳的 strptime 格式说明符字符串。用于解析和转换时间戳。支持 %Y,%y,%m,%d,%H,%I,%p,%M,%S,%f,%z 格式说明符。有关完整的解析格式规范和文档,请参阅 https://github.com/rapidsai/custrings/blob/branch-0.10/docs/source/datetime.md。public final ColumnVector asStrings()
DType.TIMESTAMP_DAYS
- "%Y-%m-%d" DType.TIMESTAMP_SECONDS
- "%Y-%m-%d %H:%M:%S" DType.TIMESTAMP_MICROSECONDS
- "%Y-%m-%d %H:%M:%S.%f" DType.TIMESTAMP_MILLISECONDS
- "%Y-%m-%d %H:%M:%S.%f" DType.TIMESTAMP_NANOSECONDS
- "%Y-%m-%d %H:%M:%S.%f"public final ColumnVector asStrings(String format)
format
- - 时间戳的 strftime 格式说明符字符串。用于解析和转换时间戳。支持 %m,%j,%d,%H,%M,%S,%y,%Y,%f 格式说明符。%d 月中的日期:01-31 %m 年中的月份:01-12 %y 不含世纪的年份:00-99 %Y 含世纪的年份:0001-9999 %H 一天中的 24 小时制:00-23 %M 小时中的分钟:00-59 %S 分钟中的秒:00-59 %f 6 位微秒:000000-999999。有关文档,请参阅 https://github.com/rapidsai/custrings/blob/branch-0.10/docs/source/datetime.md。报告的错误 https://github.com/rapidsai/cudf/issues/4160 修复后,此方法也应支持 %I 一天中的 12 小时制:01-12 %p 仅 'AM', 'PM' %j 年中的日期。public final ColumnVector isTimestamp(String format)
format
- 指定字符串中时间戳格式的字符串。public final ColumnVector extractListElement(int index)
index
- 列表中基于 0 的偏移量。负值从列表末尾向后计算。public final ColumnVector extractListElement(ColumnView indices)
indices
- 列表中基于 0 的偏移量列。负值从列表末尾向后计算。public final ColumnVector dropListDuplicates()
public final ColumnVector dropListDuplicatesWithKeysValues()
public ColumnVector flattenLists()
public ColumnVector flattenLists(boolean ignoreNull)
ignoreNull
- 是否在操作中忽略输入列中的空列表元素,或者任何包含空列表元素的行都会导致输出行为空。public final ColumnVector reverseStringsOrLists()
public final ColumnVector upper()
public final ColumnVector lower()
public final ColumnVector stringLocate(Scalar substring)
substring
- 包含要在每行中定位的字符串的标量。public final ColumnVector stringLocate(Scalar substring, int start)
substring
- 包含要在每行中定位的字符串的标量。start
- 开始搜索的字符索引(包含)。public final ColumnVector stringLocate(Scalar substring, int start, int end)
substring
- 包含要在每行中定位的字符串标量。start
- 开始搜索的字符索引(包含)。end
- 结束搜索的字符索引(不包含)。@Deprecated public final Table stringSplit(String pattern, int limit, boolean splitByRegex)
pattern
- UTF-8 编码的字符串,标识每个输入字符串的分割模式。limit
- 分割每个输入字符串产生的列表的最大大小,或 -1 表示所有可能的分割。请注意,不支持 limit = 0(所有可能的分割但不包含尾随的空字符串)和 limit = 1(完全不分割)。splitByRegex
- 一个布尔标志,指示输入字符串是按正则表达式模式分割还是仅按字符串字面量分隔符分割。public final Table stringSplit(RegexProgram regexProg, int limit)
regexProg
- 包含 UTF-8 编码字符串的 regex program,标识每个输入字符串的分割模式。limit
- 分割每个输入字符串产生的列表的最大大小,或 -1 表示所有可能的分割。请注意,不支持 limit = 0(所有可能的分割但不包含尾随的空字符串)和 limit = 1(完全不分割)。@Deprecated public final Table stringSplit(String pattern, boolean splitByRegex)
pattern
- UTF-8 编码的字符串,标识每个输入字符串的分割模式。splitByRegex
- 一个布尔标志,指示输入字符串是按正则表达式模式分割还是仅按字符串字面量分隔符分割。public final Table stringSplit(String delimiter, int limit)
delimiter
- UTF-8 编码的字符串,标识每个输入字符串的分割分隔符。limit
- 分割每个输入字符串产生的列表的最大大小,或 -1 表示所有可能的分割。请注意,不支持 limit = 0(所有可能的分割但不包含尾随的空字符串)和 limit = 1(完全不分割)。public final Table stringSplit(String delimiter)
delimiter
- UTF-8 编码的字符串,标识每个输入字符串的分割分隔符。public final Table stringSplit(RegexProgram regexProg)
regexProg
- 包含 UTF-8 编码字符串的 regex program,标识每个输入字符串的分割模式。@Deprecated public final ColumnVector stringSplitRecord(String pattern, int limit, boolean splitByRegex)
pattern
- UTF-8 编码的字符串,标识每个输入字符串的分割模式。limit
- 分割每个输入字符串产生的列表的最大大小,或 -1 表示所有可能的分割。请注意,不支持 limit = 0(所有可能的分割但不包含尾随的空字符串)和 limit = 1(完全不分割)。splitByRegex
- 一个布尔标志,指示输入字符串是按正则表达式模式分割还是仅按字符串字面量分隔符分割。public final ColumnVector stringSplitRecord(RegexProgram regexProg, int limit)
regexProg
- 包含 UTF-8 编码字符串的 regex program,标识每个输入字符串的分割模式。limit
- 分割每个输入字符串产生的列表的最大大小,或 -1 表示所有可能的分割。请注意,不支持 limit = 0(所有可能的分割但不包含尾随的空字符串)和 limit = 1(完全不分割)。@Deprecated public final ColumnVector stringSplitRecord(String pattern, boolean splitByRegex)
pattern
- UTF-8 编码的字符串,标识每个输入字符串的分割模式。splitByRegex
- 一个布尔标志,指示输入字符串是按正则表达式模式分割还是仅按字符串字面量分隔符分割。public final ColumnVector stringSplitRecord(String delimiter, int limit)
delimiter
- UTF-8 编码的字符串,标识每个输入字符串的分割分隔符。limit
- 分割每个输入字符串产生的列表的最大大小,或 -1 表示所有可能的分割。请注意,不支持 limit = 0(所有可能的分割但不包含尾随的空字符串)和 limit = 1(完全不分割)。public final ColumnVector stringSplitRecord(String delimiter)
delimiter
- UTF-8 编码的字符串,标识每个输入字符串的分割分隔符。public final ColumnVector stringSplitRecord(RegexProgram regexProg)
regexProg
- 包含 UTF-8 编码字符串的 regex program,标识每个输入字符串的分割模式。public final ColumnVector substring(int start)
start
- 子字符串的起始字符索引(包含)。public final ColumnVector substring(int start, int end)
start
- 子字符串的起始字符索引(包含)。end
- 子字符串的结束字符索引(不包含)。public final ColumnVector substring(ColumnView start, ColumnView end)
start
- 包含每个字符串起始索引的向量。end
- 包含每个字符串结束索引的向量。-1 表示读取到字符串末尾。public final ColumnVector stringConcatenateListElements(ColumnView sepCol)
sepCol
- 提供连接分隔符的字符串列。public final ColumnVector stringConcatenateListElements(ColumnView sepCol, Scalar separatorNarep, Scalar stringNarep, boolean separateNulls, boolean emptyStringOutputIfEmptyList)
sepCol
- 提供连接分隔符的字符串列。separatorNarep
- 字符串标量,指示分隔符为 null 时的 null 行为。如果设置为 null 且分隔符为 null,则结果字符串将为 null。如果非 null,则此字符串将用于代替 null 分隔符。stringNarep
- 应用于替换任何非 null 列表行中的 null 字符串的字符串。如果设置为 null 且字符串为 null,则结果字符串将为 null。如果非 null,则此字符串将用于代替 null 值。separateNulls
- 如果为 true,则在 `stringNarep` 有效时,null 行也会包含分隔符。emptyStringOutputIfEmptyList
- 如果设置为 true,则任何空列表的输入行将导致空字符串。否则,将导致 null。public final ColumnVector stringConcatenateListElements(Scalar separator, Scalar narep, boolean separateNulls, boolean emptyStringOutputIfEmptyList)
separator
- 插入到每个合并字符串之间的字符串标量。narep
- 字符串标量,指示 null 行为。如果设置为 null 且行中的任何字符串为 null,则结果字符串将为 null。如果非 null,则任何列中的 null 值将由指定的字符串替换。字符串标量中的底层值可能为 null,但传入的对象不能为 null。separateNulls
- 如果为 true,则在 `narep` 有效时,null 行也会包含分隔符。emptyStringOutputIfEmptyList
- 如果设置为 true,则任何空列表的输入行将导致空字符串。否则,将导致 null。public final ColumnVector repeatStrings(int repeatTimes)
repeatTimes
参数指定的次数。特殊情况:- 如果 repeatTimes
不是正数,非 null 输入字符串将始终导致空输出字符串。- 无论 repeatTimes
参数的值如何,空输入字符串将始终导致空输出字符串。repeatTimes
- 每个输入字符串重复的次数。public final ColumnVector repeatStrings(ColumnView repeatTimes)
repeatTimes
数值列中相应行给定的次数来生成输出字符串列。特殊情况:- 任何空行(无论是输入字符串列还是 repeatTimes
列)都将始终导致空输出字符串。- 如果 repeatTimes
列中的任何值不是正数且其对应的输入字符串不为 null,则输出字符串将为空字符串。repeatTimes
- 包含每个输入字符串重复次数的列。public final ColumnVector getJSONObject(Scalar path, GetJsonObjectOptions options)
path
- 要应用于每行的 JSONPath 字符串。path
- 控制 get_json_object 行为的 GetJsonObjectOptions。public final ColumnVector getJSONObject(Scalar path)
path
- 要应用于每行的 JSONPath 字符串。public final ColumnVector stringReplace(Scalar target, Scalar replace)
target
- 要在每个字符串中搜索的字符串。replace
- 如果找到目标字符串,则用于替换的字符串。public final ColumnVector stringReplace(ColumnView targets, ColumnView repls)
targets
- 要在每个字符串中搜索的字符串。repls
- 目标字符串对应的替换字符串。@Deprecated public final ColumnVector replaceRegex(String pattern, Scalar repl)
pattern
- 要在每个字符串中搜索的正则表达式模式。repl
- 用于替换每个模式匹配的字符串标量。public final ColumnVector replaceRegex(RegexProgram regexProg, Scalar repl)
regexProg
- 包含要在每个字符串中搜索的模式的 regex program。repl
- 用于替换每个模式匹配的字符串标量。@Deprecated public final ColumnVector replaceRegex(String pattern, Scalar repl, int maxRepl)
pattern
- 要在每个字符串中搜索的正则表达式模式。repl
- 用于替换每个模式匹配的字符串标量。maxRepl
- 在每个字符串中替换的最大次数。public final ColumnVector replaceRegex(RegexProgram regexProg, Scalar repl, int maxRepl)
regexProg
- 包含要在每个字符串中搜索的模式的 regex program。repl
- 用于替换每个模式匹配的字符串标量。maxRepl
- 在每个字符串中替换的最大次数。public final ColumnVector replaceMultiRegex(String[] patterns, ColumnView repls)
patterns
- 要在每个字符串中搜索的正则表达式模式。repls
- 用于替换每个相应模式匹配的字符串标量。@Deprecated public final ColumnVector stringReplaceWithBackrefs(String pattern, String replace)
pattern
- 要在每个字符串中搜索的正则表达式模式。replace
- 用于创建输出字符串的替换模板。public final ColumnVector stringReplaceWithBackrefs(RegexProgram regexProg, String replace)
regexProg
- 包含要在每个字符串中搜索的模式的 regex program。replace
- 用于创建输出字符串的替换模板。public final ColumnVector zfill(int width)
width
- 每个字符串的最小字符数。public final ColumnVector pad(int width)
width
- 每个字符串的最小字符数。public final ColumnVector pad(int width, PadSide side)
width
- 每个字符串的最小字符数。side
- 在何处添加新字符。public final ColumnVector pad(int width, PadSide side, String fillChar)
width
- 每个字符串的最小字符数。side
- 在何处添加新字符。fillChar
- 包含要添加内容的单个字符字符串。public final ColumnVector startsWith(Scalar pattern)
pattern
- 包含要在列字符串开头搜索的字符串的标量。public final ColumnVector endsWith(Scalar pattern)
pattern
- 包含要在列字符串末尾搜索的字符串的标量。public final ColumnVector strip()
public final ColumnVector strip(Scalar toStrip)
toStrip
- UTF-8 编码的要从每个字符串中剥离的字符。public final ColumnVector lstrip()
public final ColumnVector lstrip(Scalar toStrip)
toStrip
- UTF-8 编码的要从每个字符串中剥离的字符。public final ColumnVector rstrip()
public final ColumnVector rstrip(Scalar toStrip)
toStrip
- UTF-8 编码的要从每个字符串中剥离的字符。public final ColumnVector stringContains(Scalar compString)
compString
- 包含要搜索的字符串的标量。public final ColumnVector[] stringContains(ColumnView targets)
targets
- UTF-8 编码的要在 `input` 中每个字符串中搜索的字符串。public final ColumnVector clamp(Scalar lo, Scalar hi)
lo
- 最小 clamp 值。所有小于 `lo` 的元素将替换为 `lo`。如果为 null,则忽略。hi
- 最大 clamp 值。所有大于 `hi` 的元素将替换为 `hi`。如果为 null,则忽略。public final ColumnVector clamp(Scalar lo, Scalar loReplace, Scalar hi, Scalar hiReplace)
lo
- 最小 clamp 值。所有小于 `lo` 的元素将替换为 `loReplace`。如果为 null,则忽略。loReplace
- 所有小于 `lo` 的元素将替换为 `loReplace`。hi
- 最大 clamp 值。所有大于 `hi` 的元素将替换为 `hiReplace`。如果为 null,则忽略。hiReplace
- 所有大于 `hi` 的元素将替换为 `hiReplace`。@Deprecated public final ColumnVector matchesRe(String pattern)
pattern
- 要与每个字符串匹配的 Regex 模式。public final ColumnVector matchesRe(RegexProgram regexProg)
regexProg
- 要与每个字符串匹配的 Regex program。@Deprecated public final ColumnVector containsRe(String pattern)
pattern
- 要与每个字符串匹配的 Regex 模式。public final ColumnVector containsRe(RegexProgram regexProg)
regexProg
- 要与每个字符串匹配的 Regex program。@Deprecated public final Table extractRe(String pattern) throws CudfException
pattern
- 要使用的模式。CudfException
- 如果发生任何错误,包括 RE 不包含任何捕获组。public final Table extractRe(RegexProgram regexProg) throws CudfException
regexProg
- 要使用的 regex program。CudfException
- 如果发生任何错误,包括 regex program 不包含任何捕获组。@Deprecated public final ColumnVector extractAllRecord(String pattern, int idx)
pattern
- Regex 模式。idx
- Regex 组索引。public final ColumnVector extractAllRecord(RegexProgram regexProg, int idx)
regexProg
- Regex program。idx
- Regex 组索引。public final ColumnVector like(Scalar pattern, Scalar escapeChar)
pattern
- 用于与每个字符串匹配的 Like 模式。escapeChar
- 指定转义前缀的字符;默认为 "\\"。public final ColumnVector urlDecode() throws CudfException
任何空条目将导致输出列中出现相应的空条目。
CudfException
public final ColumnVector urlEncode() throws CudfException
任何空条目将导致输出列中出现相应的空条目。
CudfException
public final ColumnVector getMapValue(ColumnView keys)
keys
- 用于在列中查找的键列视图。public final ColumnVector getMapValue(Scalar key)
key
- 用于在列中查找的标量键。public final ColumnVector getMapKeyExistence(Scalar key)
key
- 用于在列中查找的 String 标量。public final ColumnVector getMapKeyExistence(ColumnView keys)
keys
- 用于在列中查找的键。public static ColumnView makeStructView(long rows, ColumnView... columns)
rows
- struct 列中的行数。如果未提供列,则需要此参数。columns
- 要按顺序添加到 struct 中的列。public static ColumnView makeStructView(ColumnView... columns)
columns
- 要按顺序添加到 struct 中的列。public static ColumnView fromDeviceBuffer(BaseDeviceMemoryBuffer buffer, long startOffset, DType type, int rows)
buffer
- 支持列视图的设备内存。startOffset
- 列数据在设备缓冲区中的字节偏移量。type
- 列视图中的数据类型。rows
- 列视图中的数据元素数量。public final ColumnVector listContains(Scalar key)
key
- 要查找的标量。public final ColumnVector listContainsColumn(ColumnView key)
key
- 包含查找值的 ColumnVector。public final ColumnVector listContainsNulls()
public final ColumnVector listIndexOf(Scalar key, ColumnView.FindOptions findOption)
key
- 标量搜索键。findOption
- 是查找键的第一个索引还是最后一个索引。public final ColumnVector listIndexOf(ColumnView keys, ColumnView.FindOptions findOption)
keys
- 搜索键的 ColumnView。findOption
- 是查找键的第一个索引还是最后一个索引。public final ColumnVector listSortRows(boolean isDescending, boolean isNullSmallest)
isDescending
- 是否按降序(或升序)对每行排序。isNullSmallest
- 是否将 null 值视为最小值(或最大值)。public static ColumnVector listsHaveOverlap(ColumnView lhs, ColumnView rhs)
lhs
- 一侧的输入列表列。rhs
- 另一侧的输入列表列。public static ColumnVector listsIntersectDistinct(ColumnView lhs, ColumnView rhs)
lhs
- 一侧的输入列表列。rhs
- 另一侧的输入列表列。public static ColumnVector listsUnionDistinct(ColumnView lhs, ColumnView rhs)
lhs
- 一侧的输入列表列。rhs
- 另一侧的输入列表列。public static ColumnVector listsDifferenceDistinct(ColumnView lhs, ColumnView rhs)
lhs
- 一侧的输入列表列。rhs
- 另一侧的输入列表列。public final ColumnVector generateListOffsets()
public final Scalar getScalarElement(int index)
index
- 要查看的索引。CudfException
- 如果索引越界。public final ColumnVector applyBooleanMask(ColumnView booleanMaskView)
给定一个布尔值列表列,该函数生成一个与此列类型相同的新 `LIST` 列,其中仅当对应的 `boolean_mask` 非 null 且为 `true` 时,才从该行复制每个元素。
例如:column = { {0,1,2}, {3,4}, {5,6,7}, {8,9} }; boolean_mask = { {0,1,1}, {1,0}, {1,1,1}, {0,0} }; results = { {1,2}, {3}, {5,6,7}, {} };
此列和 `boolean_mask` 必须具有相同的行数。输出列与此列具有相同的行数。仅当对应的 boolean_mask 元素为 `true` 时,才将元素复制到输出行。仅当行为无效时,输出行才无效。
booleanMaskView
- 一个可为 null 的布尔值列表列,用于过滤此列中的元素。CudfException
- 如果 `boolean_mask` 不是“布尔值列表”列。CudfException
- 如果此列和 `boolean_mask` 的行数不同。public int distinctCount(NullPolicy nullPolicy)
nullPolicy
- 是否应包含 null。public int distinctCount()
protected static long title(long handle)
public HostColumnVector copyToHost(HostMemoryAllocator hostMemoryAllocator)
public HostColumnVector copyToHostAsync(Cuda.Stream stream, HostMemoryAllocator hostMemoryAllocator)
public HostColumnVector copyToHost()
public HostColumnVector copyToHostAsync(Cuda.Stream stream)
public long getHostBytesRequired()
public static long hostPaddingSizeInBytes()
public boolean hasNonEmptyNulls()
public ColumnVector purgeNonEmptyNulls()
public ColumnVector toHex()
版权所有 © 2025。保留所有权利。