聚焦前沿科技,助力产业升级

超体RAG数据平台

超体RAG数据库介绍
超体RAG数据库 是一款基于内存的分布式数据库、缓存和处理平台,专为事务性、分析性和流式工作负载设计,支持PB级规模的数据处理速度。该数据库为应用程序与不同数据源之间提供了一个高效、分布式的内存数据组织与管理框架,旨在实现快速数据检索与生成的完美结合。作为一款分布式内存数据库,超体RAG数据库 支持ACID事务,兼容SQL查询,提供灵活的Key-Value存储、计算引擎、机器学习接口及其他数据处理API,特别适合用于RAG(检索增强生成)任务,能够优化大规模信息检索和生成任务的效率和准确性。

Jack GenAI技术负责人

CTRAG-DB特点

分布式SQL
数据库带有兼容ANSI-99的可水平扩展和容错的分布式SQL数据库,可以直接通过在集群节点之间分区数据或通过完全复制来提供分发。同时数据库完全支持分布式SQL JOIN,可以以并置和非并置方式注入数据。当并置时JOIN会在每个节点上可用的本地数据上执行,而无需在网络上移动大型数据集。
数据网格化
数据库具有实时按需增加节点的能力。可以支持线性扩展到几百个节点,通过数据位置的强语义以及数据关系路由来降低冗余数据噪声。数据网格是一个基于内存的分布式键值存储,可以视为一个分布式的分区化哈希,每个集群节点都持有所有数据的一部分,这意味着随着集群节点的增加,就可以缓存更多的数据。
集群部署
数据库集群基于无共享架构,所有的集群节点都是平等的,独立的,整个集群不存在单点故障。 数据库可以独立运行,可以组成集群,可以运行于Kubernetes和Docker容器中,也可以运行在Apache Mesos以及Hadoop Yarn上,可以运行于虚拟机和云环境,也可以运行于物理机,从技术上来说,集群部署在哪里,是没有限制的。
多语言支持
数据库是以Java语言为主进行开发的,因此可以在JVM支持的任何操作系统和架构上部署和运行,支持x86、x64、SPARC、PowerPC指令集架构。除Java,数据库还为Java、.NET和C++开发者提供原生的SQL API。
机器深度学习
数据库机器学习是一套简单、可扩展以及高效的工具,可以构建可预测的机器学习模型,而不需要昂贵的数据传输。同时机器学习能够对节点的故障容错,意味着如果在学习期间节点出现故障,所有的恢复过程对用户是透明的,学习过程不会被中断,就像所有节点都正常那样获得结果。

数据库优势