Home

共享边缘节点(Shared Edge Instance)

开箱即用的多租户 LLM 网关 —— 充值即可调用全部模型


共享边缘节点(Shared Edge Instance) 是 Hydite Vtslx AO 的默认部署形态:你不需要自建任何基础设施,只需在控制台领取一把 API Key,就能立即调用平台内全部供应商和模型。所有租户共享一套多区域 AO 网关集群,由 Hydite 负责高可用、扩缩容、安全升级与成本优化。

何时选择共享实例

适合不适合
个人开发者、初创团队、AI 应用 PoC必须本地化数据存储的金融 / 政企客户
月度调用量在百万 ~ 千万 token 区间月度调用量 > 单实例 1000 RPM 持续峰值
想用一把 Key 快速接入数十家供应商需要专属 IP 出口或定制化 SLA 99.99%
价格敏感、按用量计费需要审计合规(HIPAA / 等保三级以上)

如果你的诉求落在右栏,请直接看 Dedicated Instance

架构总览

1
┌──────────────────────────────┐
2
Your App ── HTTPS │ Edge Gateway (多 Region) │
3
│ • TLS / 鉴权 / 速率限制 │
4
│ • Anomaly 拦截 / 路由分发 │
5
└──────────────┬───────────────┘
6
7
┌──────────────▼───────────────┐
8
│ AO Routing Engine │
9
│ • Provider 路由 / Fallback │
10
│ • Cost 计算 / 用量上报 │
11
│ • 语义缓存 / Guardrails │
12
└──────────────┬───────────────┘
13
┌────────────────────┼────────────────────┐
14
OpenAI · Anthropic · Google · DeepSeek · 通义 · 智谱 · …
  • 边缘网关(Edge Gateway) 处理 TLS 终端、API Key 鉴权、IP/UA 风控、限流与异常拦截。
  • AO 路由引擎(AO Routing Engine) 提供 OpenAI 兼容协议、多供应商路由、自动 Fallback、语义缓存与用量记账。
  • 内置高速缓存与持久化层负责存储 Key、配额与调用元数据。
  • 所有节点位于离用户最近的边缘区域,TLS 1.3 + HTTP/2,国内常见首字延迟 < 80ms。

1. 接入三步走#

Step 1 — 获取 API Key#

控制台 → API Keys 页签可以查看所有已签发的密钥。新用户可通过以下任一方式拿到第一把可用 Key:

  1. 激活码(Activation Code):在 Activation Codes 页面用一次性激活码兑换初始额度,适合官方推广 / 渠道商分发。
  2. 充值码(Credit Code):在 Credit Codes 页面充值任意金额到当前账户,用量从余额中实时扣减。
  3. 订阅计划(Plans):在 Plans 页面订阅按月计费的 Pro / Team 套餐,享受打包额度与限流提升。
  4. 企业开票:联系销售开通企业账户后,由管理员在 Workspaces 内统一签发。

签发出来的 Key 形如:

1
sk-hydite-3f2a8b9c0d1e4f5a6b7c8d9e0f1a2b3c

⚠️ Key 仅在生成那一刻可见,请立即妥善保存。如果遗失,前往控制台 Regenerate 即可。

Step 2 — 选择 Channel(可选)#

每个账户默认归属于一个 Default Channel(默认渠道),其中包含平台精选、性价比最高的模型组合。如果你需要:

  • 把不同环境(dev / staging / prod)的流量隔离
  • 给特定团队 / 客户分配定制模型白名单
  • 走专线或独立计费

可以在 Channels 页面创建额外渠道,并把 Key 绑定到对应渠道。每个 Channel 对应一组独立的模型组合,路由、限流、计费三件事都按渠道分账。

Step 3 — 发起第一次调用#

1
export HYDITE_API_KEY=sk-hydite-...
2
3
curl https://api.hydite.com/v1/chat/completions \
4
-H "Authorization: Bearer $HYDITE_API_KEY" \
5
-H "Content-Type: application/json" \
6
-d '{
7
"model": "claude-sonnet-4-5",
8
"messages": [{"role":"user","content":"你好,介绍下你自己"}]
9
}'

或者直接复用 OpenAI 官方 SDK(零代码改动):

1
from openai import OpenAI
2
client = OpenAI(
3
api_key=os.environ["HYDITE_API_KEY"],
4
base_url="https://api.hydite.com/v1",
5
)
6
resp = client.chat.completions.create(
7
model="deepseek-v3",
8
messages=[{"role": "user", "content": "ping"}],
9
)

完整接口清单见 API Reference

2. 配额与计费#

控制台 Billing + Revenue 两个页签实时展示账户内的:

  • Spend / Budget:当前消费与预算上限,支持按 Key / 用户 / 团队 / 渠道下钻。
  • Token 用量:按模型、按时间维度(小时 / 日 / 月)汇总,便于成本归因。
  • Top Models / Top Users:消费 Top 排行,便于在异常账单时快速定位源头。

计费粒度精确到单次请求的 prompt + completion token 成本,由 AO 路由引擎根据每家供应商的最新单价表实时折算成统一的 USD 计价。所有交易保留最少 90 天审计记录,可通过 /spend/logs 接口拉取。

配额维度

可在控制台 / API 上配置以下任意组合的限制:

维度说明
Budget美元预算上限,超过即拒绝请求(429 + budget_exceeded
Soft Budget软上限,达到后仅触发告警,不阻断
RPM / TPM每分钟请求数 / Token 数
Models模型白名单 / 黑名单
Expires过期时间,到点自动失效
Allowed IPs出口 IP 白名单(防 Key 外泄)

这些限制通过 Virtual Key + Team + Organization 三层结构生效:Key 本身的限制 ⊆ 所属 Team ⊆ 所属 Organization,最严格的那层先触发。

3. 限流与异常防护#

共享实例对所有租户启用了多层防滥用机制

  • 网关层:基于 IP / Key 维度的全局滑动窗口限流(默认 60 RPM、1M TPM,可在控制台调整)。

  • 路由层:每个 Key 独立的 RPM / TPM 计数,触发后返回标准 429

    1
    { "error": { "type": "rate_limit_error", "code": "rpm_limit", "message": "Rate limit exceeded" } }
  • Anomaly Detection(异常检测):控制台 Anomaly 页签自动监测:

    • 单 Key 短时间内消费突增 > 历史均值 10×
    • 同一 Key 在多地区/多 IP 并发调用(疑似泄露)
    • 单次请求 token 数异常(潜在 prompt 注入 / 数据回吐)
    • 失败率突增(疑似上游异常或越狱尝试)

    命中规则后系统会自动暂停 Key 并发出告警邮件,可在控制台一键解除。

  • Guardrails:可在 Key / 渠道级别开启 PII 脱敏、Moderation、提示词注入检测等内容安全策略,由 /guardrails/apply_guardrail 接口在每次请求前置执行。

4. 路由与高可用#

AO 路由引擎在共享实例上启用了完整的多供应商路由策略

  • Latency-based routing:实时按 P95 延迟挑选最优部署。
  • Cost-based routing:在多家可用模型中选择当下单价最低的实现。
  • Fallback chains:例如 claude-sonnet-4-5claude-3-7-sonnetgpt-4o,前者超时或限流自动顺延。
  • Retry policy:对幂等的 5xx 错误自动重试(默认 2 次,指数退避)。
  • 语义缓存:可在 Channel 上启用,命中时返回 0 token 计费。

所有路由决策、Fallback 与 Retry 都会写入 /spend/logs,并在 System Health 控制台聚合展示。

5. 可观测性#

控制台页签数据来源用途
Overview/spend/* + 网关指标关键指标总览(QPS / Spend / Latency / Error %)
System Health/health/* + 各组件探针网关 · 路由引擎 · 缓存 · 数据库实时状态
Anomaly调用日志 + 风控规则异常事件流
API Keys/key/list全部签发 Key 与状态
Channels自定义模型分组渠道列表与默认渠道

如需对接到自有 SIEM / Grafana,可使用:

  • GET /metrics — Prometheus 格式
  • GET /spend/logs — 调用明细 JSON
  • Webhook(在控制台 Profile → Notifications 配置)

6. 数据合规#

  • 共享实例默认不持久化任何 prompt 或 completion 内容,仅存储用量元数据。
  • 如需审计完整对话内容,可在 Channel 上显式开启 Logging(独立加密、独立 Bucket、可设保留期)。
  • 全部传输强制 TLS 1.3,控制台与 API 域名均启用 HSTS。
  • 不会用任何用户数据训练模型,第三方供应商也通过 metadata: { "no_log": true } 透传 opt-out 标志。

7. 与 Dedicated Instance 的差异#

Shared EdgeDedicated
部署位置Hydite 多区域边缘单租户专属(云 / 本地)
起步成本即开即用、按量计费月度起 + 可选按量
自定义路由策略控制台预设完全自定义 YAML
数据驻留默认不持久化100% 用户掌控
SLA99.9%99.95%+
适用规模< 1000 RPM 持续峰值任意规模

升级路径:在控制台 Workspaces → Upgrade to Dedicated 一键发起,原 Key 与配额会无缝迁移,无需改动任何业务代码。

下一步