Hydite Vtslx AO
统一的大模型 API 聚合与编排平台
Hydite Vtslx AO 是一款统一的 API 聚合平台,将数十家供应商、上百款大语言模型(LLM)整合到一个一致的 API 接口中。无论你是在构建 AI 应用、做模型评测,还是运维企业级 AI 基础设施,Vtslx AO 都能消除多供应商 SDK、API Key 与计费关系所带来的复杂度。
支持的模型与供应商
Vtslx AO 覆盖整个大模型生态:
- 海外旗舰模型 —— OpenAI(GPT-5.5、GPT-5.5 Pro、GPT-5.2、GPT-5.5 Instant)、Anthropic(Claude Opus 4.7、Claude Sonnet 4.6、Claude Haiku 4.5、Claude Mythos)、Google(Gemini 3.1、Gemini 3.1 Flash)、Meta(Llama 4 Behemoth、Llama 4 Maverick、Muse Spark)
- 国产模型 —— DeepSeek(V4 Pro、V4 Flash、R1-0528)、通义千问(Qwen3.6、Qwen3.6-Max、Qwen3-Coder-Next、QwQ-32B)、智谱(GLM-5)、月之暗面(Kimi K2.6)、MiniMax(M2.7)、字节跳动(Doubao Seed 2.0)、阶跃星辰(Step 3.5 Flash)
- 开源与垂类模型 —— Mistral(Large 3、Small 4)、xAI(Grok Heavy、Grok 4)、Cohere(Command R+)等
所有模型均通过统一的 OpenAI 兼容协议访问,切换模型只需改一个参数,无需更换 SDK。
部署方式
Vtslx AO 提供两种部署形态,适配不同的规模与安全需求:
共享实例(边缘 API)#
共享实例部署在全球分布式边缘节点之上,从任何地区接入都能获得低时延体验。适用于:
- 开发与测试
- 中小规模生产应用
- 不需要数据驻留合规的项目
共享实例与其他租户共享算力资源,通过公平限流保证整体性能稳定。
独享实例(企业版)
独享实例为企业组织专属调度独立的算力节点,提供:
- 更高并发 —— 不受共享限流影响,可在授权额度内突发使用
- 更快响应 —— 专属 GPU/CPU 资源,杜绝邻居噪声带来的时延抖动
- 私有化模型部署 —— 将微调或自研模型直接部署到企业独享节点
- 数据驻留 —— 自由选择部署区域,满足合规要求
- 自定义域名 —— 用企业自有域名提供 API 服务,TLS 完全可控
- SLA 保障 —— 企业级可用性承诺与优先级技术支持
核心能力
统一 API 协议#
所有模型说同一种"语言"。Vtslx AO 暴露 OpenAI 兼容的 /v1/chat/completions 接口,任何 OpenAI SDK 与工具链开箱即用,覆盖全部已接入模型。
API Key 分组#
将 API Key 组织成逻辑分组,共享配置 —— 限流、预算上限、模型白名单、System Prompt。分组使得在不同团队、环境或客户层级之间分配访问权限变得简单。
细粒度限流
支持在分组与单个 Key 两个层级控制用量:
- RPM(每分钟请求数)
- TPM(每分钟 Token 数)
- 预算上限(按日 / 周 / 月 / 年限制消费金额)
网关级 System Prompt#
在 API 网关层面注入 System Prompt,无需客户端改动即可保证整组 Key 行为一致。
用量分析
按模型、Key、分组多维度追踪 Token 消耗、请求量、时延分布与成本明细 —— 全部在 Vtslx AO 控制台呈现。
快速开始
- 在 Vtslx AO 控制台 创建组织
- 创建一个 API Key 分组,配置好限流与可用模型
- 生成 API Key,开始调用:
1curl https://api.hydite.com/v1/chat/completions \2 -H "Content-Type: application/json" \3 -H "Authorization: Bearer YOUR_API_KEY" \4 -d '{5 "model": "gpt-5.5",6 "messages": [{"role": "user", "content": "你好!"}]7 }'切换模型只需改 model 字段,其余代码无需调整。