连接基础节点
从“能跑通单点”到“能交付整件事”:把基础节点串起来。
只会“单点能跑”,往往还做不出“整件能用”。让基础节点彼此连上,意义才显形。
典型场景
- 我能跑通 API 示例,但接不上鉴权与队列;
- 我会单元函数,但落地到任务编排时就乱;
- 文档写得很清楚,但我“照做”还是卡在环境。
案例:模型接入只跑通了 Demo
跑通了 OpenAI/OpenRouter 的最小样例,但没接上重试、超时、quota、审计与观测。上线后偶发失败,没人知道哪一环漏了。
基础节点地图(示意)
[入口] 事件/HTTP → [鉴权] → [参数校验] → [业务处理]
→ [重试/超时] → [日志/观测] → [持久化/回溯] → [告警]对照问题:
- 失败会去哪?会重试吗?会超时退出吗?
- 我能还原一次请求的全链路吗?
- 有没有“最小可回滚路径”?
一张串接清单(可复制)
[鉴权] token/权限边界/最小化
[输入] 必填/范围/类型/默认值/危险字符
[容错] 超时/重试/幂等键/断路器
[日志] 关键上下文/trace id/隐私脱敏
[观测] 指标+分位数/告警阈值/看板位置
[数据] 持久化/版本/回滚/审计
[开关] 灰度/阈值/动态配置/最快回滚方式小步贯通法(1 天内可完成)
- 画出最短链路(入口→产出)
- 选一个失败场景(超时/400/quota),把它“走通”
- 加上观测:为这条链路加 3 个指标 + 1 个日志样例
- 写回滚剧本:如何一键关闭或降级(确认人/路径/时间)
完成的定义(DoD)
能从入口发送一个坏请求,系统记录完整上下文;能在 1 分钟内看到指标异常;能通过 1 个开关降级;能复盘出发生了什么。
陷阱与反例
- 以为“文档写了=我会了”:没有过一遍失败/恢复路径,默认就是没接好。
- 把“能跑”当“能交付”:没有观测、没有回滚、没有幂等,就是伪完成。