BDH – 大数据枢纽
BDH
- 对象存储
- 关系存储
- 流处理
- 批处理任务
- Out-of-core 核外计算
2,000¥/月 (税前)
即将推出
用于数据工程、人工智能和交易应用程序的数据枢纽平台。
一个统一平台
Rapid.Space BDH 是一个统一的平台,支持所有数据需求,包括高性能关系存储、分布式对象存储、元数据管理和重复数据处理任务。
数据湖
Rapid.Space BDH 支持从多个来源实时收集数据:机器、传感器、网站、电子商务、客户和供应商。
对象存储
所有原始数据(流、批次、ndarrays 等)都存储在分布式事务对象数据库 (NEO) 中。
关系存储
所有结构化数据(表、关系索引)都存储在高性能集群关系数据库 (MariaDB) 中。
Python native
Rapid.Space BDH 通过在分析环境和生产集群上使用 Python 来统一数据工程。
开放接口
得益于 ARM 开源数据收集解决方案 Fluentd(用于流式处理)和 Embulk(用于批处理数据)的集成,数据工程师可以从 100 多个现成的插件中进行选择,用于不同的 Web 服务和数据库。
Pydata
然后可以使用 PyData 库(如 Pandas 和 SciPy)对收集的原始数据进行聚合和结构化,最后使用机器学习工具(如 scikit-learn 或 TensorFlow)进行自动分析。
数据产业化
以业务流程为主的管理数据分析操作的方法使 Rapid.Space BDH 非常适合生产系统上重复性数据科学任务的统一和自动化。
Out-of-core 核外计算
wendelin.core 库提供的对持久性 NumPy ndarray 的本机核外访问支持可扩展的分析。 分析操作可以在不限制可用内存的情况下实现,并且不需要重新编译就在生产集群上运行。
完整 NumPy API
与依赖兼容层的其他技术不同,在访问核外 ndarray 时可以使用完整的 NumPy API。
多重云
Rapid.Space BDH 可以部署在 Rapid.Space VPS、第三方云或同时都部署。
REST API
借助 Rapid.Space REST API,自动化 Rapid.Space BDH 供应和配置。