快速入门#
向量搜索新手?#
如果您不熟悉向量搜索的基础知识,或者不了解向量搜索与向量数据库有何不同,那么这篇向量搜索入门指南应该能为您提供一些有益的见解。对于初学者来说,我们的向量数据库与向量搜索对比指南也是一个很好的资源。正如入门指南中所述,向量数据库中使用的向量搜索通常更接近于机器学习而不是传统数据库。这意味着虽然传统数据库在未进行任何性能调优时可能很慢,但它们通常仍能得到正确结果。不幸的是,向量搜索索引与其他的机器学习模型一样,如果调优不当,可能会产生错误结果。
幸运的是,这为提高向量搜索性能和质量打开了超参数优化的全新世界。请参阅我们的索引调优指南以获取更多信息。
比较向量搜索索引的性能时,务必考虑三个主要维度
构建时间
搜索质量
搜索性能
请参阅比较向量搜索索引性能入门指南,以获取更多关于方法论以及如何在评估过程中进行公平比较的信息。
支持的索引#
cuVS 支持多种标准索引类型,列表不断增长并紧跟最新技术发展。请参阅我们的向量搜索索引指南,以了解每种索引类型的更多信息、它们何时在 GPU 上有用以及它们提供的用于权衡性能和质量的调优选项。
cuVS 的主要目标是实现速度、规模和灵活性(按此顺序)——其中一个重要的价值主张是利用可扩展的 GPU 能力增强现有软件部署,以改进痛点,同时不中断当前在 CPU 上运行良好的系统部分。
使用 cuVS API#
cuVS 的核心是一个 C++ 库,它由一个 C 库包装,并通过各种不同的语言进一步暴露。cuVS 目前为C、C++、Python 和Rust 提供 API 和文档,更多语言正在开发中。我们的API 基础知识提供了关于您在使用 cuVS 类型时会遇到的重要范例和词汇类型的一些背景信息和上下文。
请参阅API 互操作性指南,以获取更多关于 cuVS 如何与 numpy、cupy、tensorflow 和 pytorch 等其他库无缝协作的信息,即使无需复制设备内存。
接下来去哪里?#
cuVS 是免费的开源软件,根据 Apache 2.0 许可。熟悉或使用 cuVS 后,您可以通过Github 最方便地访问开发者社区。如有任何 bug、问题或功能请求,请在 Github 上提交 issue。
博客#
我们经常发布关于 GPU 加速向量搜索的博客,这些博客可以深入探讨各种重要主题和突破性进展
研究#
对于有兴趣的读者,cuVS 中的许多加速实现也是基于研究论文,这些论文可以提供更多的背景信息。我们也请您在自己的研究中引用相应的算法。
参与其中#
我们始终欢迎新的功能和 bug 修复补丁。请阅读我们的贡献指南,了解有关为 cuVS 贡献补丁的更多信息。
社交媒体#
您可以通过Slack、Stack Overflow 和X 访问 RAPIDS 社区