>>> import pandas as pd
>>> df = pd.DataFrame({
...     'a': [1, 1, 2, 2],
...     'b': [1, 2, 1, 2],
...     'c': [1, 2, 3, 4],
... })
>>> gdf = cudf.from_pandas(df)
>>> df.groupby('a')[["b", "c"]].apply(lambda x: x.iloc[[0]])
     b  c
a
1 0  1  1
2 2  1  3
>>> gdf.groupby('a')[["b", "c"]].apply(lambda x: x.iloc[[0]])
   b  c
0  1  1
2  1  3

[源]

Pandas 兼容性注意事项

pandas.core.groupby.DataFrameGroupBy.shift(),: pandas.core.groupby.SeriesGroupBy.shift()

不支持 freq 参数。

[源]

Pandas 兼容性注意事项

pandas.core.groupby.DataFrameGroupBy.idxmax(),: pandas.core.groupby.SeriesGroupBy.idxmax()

numeric_only, min_count 参数

[源]

Pandas 兼容性注意事项

pandas.core.groupby.DataFrameGroupBy.idxmin(),: pandas.core.groupby.SeriesGroupBy.idxmin()

numeric_only, min_count 参数

[源]

Pandas 兼容性注意事项

pandas.Series.str.replace()

参数 case 和 flags 尚不支持，如果设置了除默认值以外的任何值，则会引发 NotImplementedError。

[源]

Pandas 兼容性注意事项

pandas.Series.str.match()

目前不支持参数 case 和 na。 flags 参数目前仅支持 re.DOTALL 和 re.MULTILINE。

[源]

Pandas 兼容性注意事项

pandas.Series.str.partition()

参数 expand 尚不支持，如果设置了除默认值以外的任何值，则会引发 NotImplementedError。

[源]

Pandas 兼容性注意事项

pandas.Series.list.sort_values

此方法在 pandas 中不存在，但可以通过以下方式运行

>>> import pandas as pd
>>> s = pd.Series([[3, 2, 1], [2, 4, 3]])
>>> print(s.apply(sorted))
0    [1, 2, 3]
1    [2, 3, 4]
dtype: object

[源]

Pandas 兼容性注意事项

pandas.Series.str.contains()

参数 case 和 na 尚不支持，如果设置了除默认值以外的任何值，则会引发 NotImplementedError。flags 参数目前仅支持 re.DOTALL 和 re.MULTILINE。

[源]

Pandas 兼容性注意事项

pandas.Series.str.endswith()

尚不支持 na 参数，因为 cudf 使用原生字符串而非 Python 对象。

[源]

Pandas 兼容性注意事项

pandas.Series.str.findall()

flags 参数目前仅支持 re.DOTALL 和 re.MULTILINE。

[源]

Pandas 兼容性注意事项

pandas.Series.str.count()

flags 参数目前仅支持 re.DOTALL 和 re.MULTILINE。
在传入 pat 时需要转义一些字符。例如，'$' 在正则表达式中具有特殊含义，在查找此字面字符时必须进行转义。

[源]

Pandas 兼容性注意事项

pandas.Series.str.extract()

flags 参数目前仅支持 re.DOTALL 和 re.MULTILINE。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.where(), pandas.Series.where()

请注意，where 将缺失值视为假值，与 pandas 处理可为空数据的方式一致

>>> gsr = cudf.Series([1, 2, 3])
>>> gsr.where([True, False, cudf.NA])
0       1
1    <NA>
2    <NA>
dtype: int64
>>> gsr.where([True, False, False])
0       1
1    <NA>
2    <NA>
dtype: int64

[源]

Pandas 兼容性注意事项

pandas.DataFrame.truncate(), pandas.Series.truncate()

copy 参数仅用于 API 兼容性，但不支持 copy=False。此方法始终会生成一个副本。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.replace(), pandas.Series.replace()

目前不支持的参数有：limit, regex, method

[源]

Pandas 兼容性注意事项

pandas.DataFrame.resample(), pandas.Series.resample()

请注意，结果中索引（或使用 ‘on=’ 时的 ‘on’ 列）的数据类型将是与重采样频率最接近的频率。例如，如果从纳秒重采样到毫秒，则索引的数据类型将是 ‘datetime64[ms]’。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.sample(), pandas.Series.sample()

当从 axis=0/'index' 进行采样时，random_state 可以是 numpy 随机状态 (numpy.random.RandomState) 或 cupy 随机状态 (cupy.random.RandomState)。当使用 numpy 随机状态时，输出保证与相应的 pandas 方法调用输出一致，但生成样本可能会很慢。如果不需要严格等同于 pandas，使用 cupy 随机状态将获得更好的性能，尤其是在采样大量项目时。建议对 weights 数组使用与 random state 相匹配的 ndarray 类型。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.sort_index(), pandas.Series.sort_index()

不支持：kind, sort_remaining=False

[源]

Pandas 兼容性注意事项

pandas.DataFrame.skew(), pandas.Series.skew()

axis 参数目前不支持。

[源]

Pandas 兼容性注意事项

pandas.Series.sort_values()

仅支持 axis=’index’。
目前不支持 inplace 和 kind 参数

[源]

Pandas 兼容性注意事项

pandas.Series.reindex()

注意：与 Pandas 的一个区别是，NA 用于不匹配的行，而不是 NaN。这带来的一个副作用是，在 cuDF 中 Series 保留了整数数据类型，而在 Pandas 中则会被转换为浮点数。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.min(), pandas.Series.min()

目前不支持的参数是 level, numeric_only。

[源]

Pandas 兼容性注意事项

pandas.Series.rename()

仅支持标量值来更改 name 属性

[源]

Pandas 兼容性注意事项

pandas.DataFrame.max(), pandas.Series.max()

目前不支持的参数是 level, numeric_only。

[源]

Pandas 兼容性注意事项

pandas.Series.map()

请注意 map 目前仅支持定宽数值类型函数。

[源]

Pandas 兼容性注意事项

pandas.Series.count()

目前不支持的参数是 level。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.ewm()

参数 min_periods, ignore_na, axis, 和 times 尚不支持。其行为仅对以有效（非空）元素开头的数据定义。

目前，仅支持 mean 方法。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.empty, pandas.Series.empty

如果 DataFrame/Series 仅包含 null 值，它仍然不被认为是空的。请参阅上面的示例。

[源]

Pandas 兼容性注意事项

pandas.Series.cov()

min_periods 参数尚不支持。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.where(), pandas.Series.where()

请注意，where 将缺失值视为假值，与 pandas 处理可为空数据的方式一致

>>> gsr = cudf.Series([1, 2, 3])
>>> gsr.where([True, False, cudf.NA])
0       1
1    <NA>
2    <NA>
dtype: int64
>>> gsr.where([True, False, False])
0       1
1    <NA>
2    <NA>
dtype: int64

[源]

Pandas 兼容性注意事项

pandas.DataFrame.min(), pandas.Series.min()

目前不支持的参数是 level, numeric_only。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.any(), pandas.Series.any()

目前不支持的参数是 axis, bool_only, level。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.all(), pandas.Series.all()

目前不支持的参数是 axis, bool_only, level。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.max(), pandas.Series.max()

目前不支持的参数是 level, numeric_only。

[源]

Pandas 兼容性注意事项

pandas.DataFrame.where(), pandas.Series.where()

请注意，where 将缺失值视为假值，与 pandas 处理可为空数据的方式一致

>>> gsr = cudf.Series([1, 2, 3])
>>> gsr.where([True, False, cudf.NA])
0       1
1    <NA>
2    <NA>
dtype: int64
>>> gsr.where([True, False, False])
0       1
1    <NA>
2    <NA>
dtype: int64