共享边缘节点(Shared Edge Instance)
开箱即用的多租户 LLM 网关 —— 充值即可调用全部模型
共享边缘节点(Shared Edge Instance) 是 Hydite Vtslx AO 的默认部署形态:你不需要自建任何基础设施,只需在控制台领取一把 API Key,就能立即调用平台内全部供应商和模型。所有租户共享一套多区域 AO 网关集群,由 Hydite 负责高可用、扩缩容、安全升级与成本优化。
何时选择共享实例
| 适合 | 不适合 |
|---|---|
| 个人开发者、初创团队、AI 应用 PoC | 必须本地化数据存储的金融 / 政企客户 |
| 月度调用量在百万 ~ 千万 token 区间 | 月度调用量 > 单实例 1000 RPM 持续峰值 |
| 想用一把 Key 快速接入数十家供应商 | 需要专属 IP 出口或定制化 SLA 99.99% |
| 价格敏感、按用量计费 | 需要审计合规(HIPAA / 等保三级以上) |
如果你的诉求落在右栏,请直接看 Dedicated Instance。
架构总览
1┌──────────────────────────────┐2 Your App ── HTTPS │ Edge Gateway (多 Region) │3 │ • TLS / 鉴权 / 速率限制 │4 │ • Anomaly 拦截 / 路由分发 │5 └──────────────┬───────────────┘6 │7 ┌──────────────▼───────────────┐8 │ AO Routing Engine │9 │ • Provider 路由 / Fallback │10 │ • Cost 计算 / 用量上报 │11 │ • 语义缓存 / Guardrails │12 └──────────────┬───────────────┘13 ┌────────────────────┼────────────────────┐14 OpenAI · Anthropic · Google · DeepSeek · 通义 · 智谱 · …- 边缘网关(Edge Gateway) 处理 TLS 终端、API Key 鉴权、IP/UA 风控、限流与异常拦截。
- AO 路由引擎(AO Routing Engine) 提供 OpenAI 兼容协议、多供应商路由、自动 Fallback、语义缓存与用量记账。
- 内置高速缓存与持久化层负责存储 Key、配额与调用元数据。
- 所有节点位于离用户最近的边缘区域,TLS 1.3 + HTTP/2,国内常见首字延迟 < 80ms。
1. 接入三步走#
Step 1 — 获取 API Key#
控制台 → API Keys 页签可以查看所有已签发的密钥。新用户可通过以下任一方式拿到第一把可用 Key:
- 激活码(Activation Code):在 Activation Codes 页面用一次性激活码兑换初始额度,适合官方推广 / 渠道商分发。
- 充值码(Credit Code):在 Credit Codes 页面充值任意金额到当前账户,用量从余额中实时扣减。
- 订阅计划(Plans):在 Plans 页面订阅按月计费的 Pro / Team 套餐,享受打包额度与限流提升。
- 企业开票:联系销售开通企业账户后,由管理员在 Workspaces 内统一签发。
签发出来的 Key 形如:
1sk-hydite-3f2a8b9c0d1e4f5a6b7c8d9e0f1a2b3c⚠️ Key 仅在生成那一刻可见,请立即妥善保存。如果遗失,前往控制台 Regenerate 即可。
Step 2 — 选择 Channel(可选)#
每个账户默认归属于一个 Default Channel(默认渠道),其中包含平台精选、性价比最高的模型组合。如果你需要:
- 把不同环境(dev / staging / prod)的流量隔离
- 给特定团队 / 客户分配定制模型白名单
- 走专线或独立计费
可以在 Channels 页面创建额外渠道,并把 Key 绑定到对应渠道。每个 Channel 对应一组独立的模型组合,路由、限流、计费三件事都按渠道分账。
Step 3 — 发起第一次调用#
1export HYDITE_API_KEY=sk-hydite-...23curl https://api.hydite.com/v1/chat/completions \4 -H "Authorization: Bearer $HYDITE_API_KEY" \5 -H "Content-Type: application/json" \6 -d '{7 "model": "claude-sonnet-4-5",8 "messages": [{"role":"user","content":"你好,介绍下你自己"}]9 }'或者直接复用 OpenAI 官方 SDK(零代码改动):
1from openai import OpenAI2client = OpenAI(3 api_key=os.environ["HYDITE_API_KEY"],4 base_url="https://api.hydite.com/v1",5)6resp = client.chat.completions.create(7 model="deepseek-v3",8 messages=[{"role": "user", "content": "ping"}],9)完整接口清单见 API Reference。
2. 配额与计费#
控制台 Billing + Revenue 两个页签实时展示账户内的:
- Spend / Budget:当前消费与预算上限,支持按 Key / 用户 / 团队 / 渠道下钻。
- Token 用量:按模型、按时间维度(小时 / 日 / 月)汇总,便于成本归因。
- Top Models / Top Users:消费 Top 排行,便于在异常账单时快速定位源头。
计费粒度精确到单次请求的 prompt + completion token 成本,由 AO 路由引擎根据每家供应商的最新单价表实时折算成统一的 USD 计价。所有交易保留最少 90 天审计记录,可通过 /spend/logs 接口拉取。
配额维度
可在控制台 / API 上配置以下任意组合的限制:
| 维度 | 说明 |
|---|---|
| Budget | 美元预算上限,超过即拒绝请求(429 + budget_exceeded) |
| Soft Budget | 软上限,达到后仅触发告警,不阻断 |
| RPM / TPM | 每分钟请求数 / Token 数 |
| Models | 模型白名单 / 黑名单 |
| Expires | 过期时间,到点自动失效 |
| Allowed IPs | 出口 IP 白名单(防 Key 外泄) |
这些限制通过 Virtual Key + Team + Organization 三层结构生效:Key 本身的限制 ⊆ 所属 Team ⊆ 所属 Organization,最严格的那层先触发。
3. 限流与异常防护#
共享实例对所有租户启用了多层防滥用机制:
-
网关层:基于 IP / Key 维度的全局滑动窗口限流(默认 60 RPM、1M TPM,可在控制台调整)。
-
路由层:每个 Key 独立的 RPM / TPM 计数,触发后返回标准
429:1{ "error": { "type": "rate_limit_error", "code": "rpm_limit", "message": "Rate limit exceeded" } } -
Anomaly Detection(异常检测):控制台 Anomaly 页签自动监测:
- 单 Key 短时间内消费突增 > 历史均值 10×
- 同一 Key 在多地区/多 IP 并发调用(疑似泄露)
- 单次请求 token 数异常(潜在 prompt 注入 / 数据回吐)
- 失败率突增(疑似上游异常或越狱尝试)
命中规则后系统会自动暂停 Key 并发出告警邮件,可在控制台一键解除。
-
Guardrails:可在 Key / 渠道级别开启 PII 脱敏、Moderation、提示词注入检测等内容安全策略,由
/guardrails/apply_guardrail接口在每次请求前置执行。
4. 路由与高可用#
AO 路由引擎在共享实例上启用了完整的多供应商路由策略:
- Latency-based routing:实时按 P95 延迟挑选最优部署。
- Cost-based routing:在多家可用模型中选择当下单价最低的实现。
- Fallback chains:例如
claude-sonnet-4-5→claude-3-7-sonnet→gpt-4o,前者超时或限流自动顺延。 - Retry policy:对幂等的 5xx 错误自动重试(默认 2 次,指数退避)。
- 语义缓存:可在 Channel 上启用,命中时返回 0 token 计费。
所有路由决策、Fallback 与 Retry 都会写入 /spend/logs,并在 System Health 控制台聚合展示。
5. 可观测性#
| 控制台页签 | 数据来源 | 用途 |
|---|---|---|
| Overview | /spend/* + 网关指标 | 关键指标总览(QPS / Spend / Latency / Error %) |
| System Health | /health/* + 各组件探针 | 网关 · 路由引擎 · 缓存 · 数据库实时状态 |
| Anomaly | 调用日志 + 风控规则 | 异常事件流 |
| API Keys | /key/list | 全部签发 Key 与状态 |
| Channels | 自定义模型分组 | 渠道列表与默认渠道 |
如需对接到自有 SIEM / Grafana,可使用:
GET /metrics— Prometheus 格式GET /spend/logs— 调用明细 JSON- Webhook(在控制台 Profile → Notifications 配置)
6. 数据合规#
- 共享实例默认不持久化任何 prompt 或 completion 内容,仅存储用量元数据。
- 如需审计完整对话内容,可在 Channel 上显式开启 Logging(独立加密、独立 Bucket、可设保留期)。
- 全部传输强制 TLS 1.3,控制台与 API 域名均启用 HSTS。
- 不会用任何用户数据训练模型,第三方供应商也通过
metadata: { "no_log": true }透传 opt-out 标志。
7. 与 Dedicated Instance 的差异#
| Shared Edge | Dedicated | |
|---|---|---|
| 部署位置 | Hydite 多区域边缘 | 单租户专属(云 / 本地) |
| 起步成本 | 即开即用、按量计费 | 月度起 + 可选按量 |
| 自定义路由策略 | 控制台预设 | 完全自定义 YAML |
| 数据驻留 | 默认不持久化 | 100% 用户掌控 |
| SLA | 99.9% | 99.95%+ |
| 适用规模 | < 1000 RPM 持续峰值 | 任意规模 |
升级路径:在控制台 Workspaces → Upgrade to Dedicated 一键发起,原 Key 与配额会无缝迁移,无需改动任何业务代码。
下一步
- 查看完整接口清单 → API Reference
- 配置多渠道隔离 → API Key Groups
- 速率与预算最佳实践 → Rate Limiting
- 评估企业方案 → Dedicated Instance