"那我们就自己建"
这是给每一个试图从头开始为每个租户提供基础设施的团队的最后一句名言。
一开始很简单:为每个客户启动一个容器,分配一些流量,就可以了,对吗?
然后你需要持久存储,然后是环境隔离,然后是通配符 DNS,然后是每个子域的 SSL,然后是配置 API,然后是每个租户的监控,然后是独立扩展。
三个月后,你的信息工程师正在维护一个定制的协调系统,而不是提供客户实际要求的功能。
DIY 供应的冰山
看似 "只需启动一个容器",实际上是一大堆相互关联的问题,而且这些问题还在不断增加。
容器协调
需要健康检查、故障时自动重启、资源限制,以便一个租户占用整个主机。
如果您使用的是 kubernetes,那就需要为每个租户编写部署、服务、入口、PersistentVolumeClaims、ConfigMaps 和 Secrets。
网络和路由
通配符 DNS、基于子域路由的反向代理、每个租户的 SSL 证书(或适当管理的通配符证书,这也是一个令人头疼的问题)。
企业客户绝对需要 ai.theircompany.com,而不是 slug.yourdomain.com。这意味着每个自定义域都需要 DNS 验证、证书配置和代理重新配置。
持久存储
容器是短暂的,但您的客户数据却不是。您需要持久卷,以便在重启和重新部署、备份策略后仍能存活,而且您必须确保一个租户卷永远不会被另一个租户卷访问。
环境隔离
API 密钥、模型配置、功能标志、速率限制。每个租户都需要在运行时注入自己的一组环境变量。您需要一种安全的方式来存储、更新和轮换这些环境变量,而无需重新部署整个系统。
供应自动化
您需要一个配置 API,在一次操作中创建容器、卷、网络配置、DNS 记录、SSL 证书和环境变量。
监测和可观察性
你需要每个租户的指标 - CPU、内存、磁盘、网络。你需要每个租户的指标 - CPU、内存、磁盘、网络、健康状况、正常运行时间跟踪、警报。你需要在租户 47 提交支持单之前就知道他们的运行状况,而不是之后。
真正的代价是机会
工程时间是很昂贵,但这不是最大的成本,最大的成本是机会。
你的团队花在基础设施建设上的每一周,都是他们没有花在工作上的一周:
- 使您的产品与众不同的功能
- 将试用用户转化为付费用户的入职流程
- 通过整合开拓新市场
- 客户付费购买的实际人工智能功能
您的客户并不关心您的配置系统,他们关心的是您的人工智能能为他们做些什么。基础架构是必要的,但它并不能与众不同。您在基础架构上花费的时间越少,您在真正重要的事情上花费的时间就越多。
赡养税(不过是永久性的)
老实说,这才是最容易的部分。
基础设施永远需要持续维护:
- 容器运行时更新和安全补丁
- SSL 证书更新(它们会过期,总是在最糟糕的时候过期。)
- 存储容量规划
- 网络配置更改
- 监测系统维护
- 事件响应程序
- 为团队编写文档(虽然没人看,但你还是得写)
这是对工程能力的永久性征税。它不会随着产品的成熟而缩减,而是随着租户数量的增加而增长。更多的租户 = 更多的故障 = 更多的维护时间而不是建设时间。
当 DIY 真正有意义时
公平地说,在特定情况下,建立自己的系统是有意义的:
- 您拥有一支专职的基础设施团队,无暇顾及其他事务
- 您的隔离要求非常特殊,没有任何平台支持这些要求
- 基础设施本身就是您的竞争优势
- 您正在进行大规模运营,平台成本确实超过了建造成本
对于大多数开发人工智能产品的团队来说,这些都不适用。
ShipClaw 取代了什么
ShipClaw 以可视化构建器和部署按钮取代了上述整个堆栈。
| DIY component | ShipClaw equivalent |
|---|---|
| Container orchestration | drag a Runtime node onto canvas |
| Networking and routing | Gateway node handles wildcard routing + SSL |
| Persistent storage | Volume node mounts at /data automatically |
| Environment isolation | Env Config node per tenant |
| Provisioning automation | click deploy. platform does everything. |
| Monitoring | built-in dashboard with per-tenant metrics |
| Custom domains | Custom Domain node with automatic SSL |
没有 Dockerfile,没有 Kubernetes 清单,没有 terraform,没有需要构建和维护的供应 API。
以可视化方式设计拓扑结构,然后进行部署。
算术
由两名工程师组成的团队建立 DIY 租户供应系统的粗略估算:
- 初始构建: 8-12 周的重点工程(假设没有出错,笑)。
- 持续维护: 每周 10-20 小时,每周一次,直到永远
- **事故反应:**不可预测,但保证在最坏的情况下发生
- 机会成本: ~3 个月的产品开发就这么没了
ShipClaw 可以让您在一个下午内获得同样的结果。
底线
DIY 租户供应是一个陷阱,看起来是一个周末项目,但却会变成一个永久性的工程承诺,慢慢地将你的团队生吞活剥。
问题不在于 "我们能建吗?"--你能,每个团队都能,问题是 "我们应该建吗?"
对于大多数团队来说,答案是否定的。使用平台,交付产品,不要再把最好的工程师的时间花在已经解决的问题上。
