lai.rui

连接基础节点

从“能跑通单点”到“能交付整件事”:把基础节点串起来。

只会“单点能跑”,往往还做不出“整件能用”。让基础节点彼此连上,意义才显形。

典型场景

  • 我能跑通 API 示例,但接不上鉴权与队列;
  • 我会单元函数,但落地到任务编排时就乱;
  • 文档写得很清楚,但我“照做”还是卡在环境。

案例:模型接入只跑通了 Demo 跑通了 OpenAI/OpenRouter 的最小样例,但没接上重试、超时、quota、审计与观测。上线后偶发失败,没人知道哪一环漏了。

基础节点地图(示意)

[入口] 事件/HTTP → [鉴权] → [参数校验] → [业务处理]
  → [重试/超时] → [日志/观测] → [持久化/回溯] → [告警]

对照问题:

  • 失败会去哪?会重试吗?会超时退出吗?
  • 我能还原一次请求的全链路吗?
  • 有没有“最小可回滚路径”?

一张串接清单(可复制)

[鉴权] token/权限边界/最小化
[输入] 必填/范围/类型/默认值/危险字符
[容错] 超时/重试/幂等键/断路器
[日志] 关键上下文/trace id/隐私脱敏
[观测] 指标+分位数/告警阈值/看板位置
[数据] 持久化/版本/回滚/审计
[开关] 灰度/阈值/动态配置/最快回滚方式

小步贯通法(1 天内可完成)

  1. 画出最短链路(入口→产出)
  2. 选一个失败场景(超时/400/quota),把它“走通”
  3. 加上观测:为这条链路加 3 个指标 + 1 个日志样例
  4. 写回滚剧本:如何一键关闭或降级(确认人/路径/时间)

完成的定义(DoD)

能从入口发送一个坏请求,系统记录完整上下文;能在 1 分钟内看到指标异常;能通过 1 个开关降级;能复盘出发生了什么。

陷阱与反例

  • 以为“文档写了=我会了”:没有过一遍失败/恢复路径,默认就是没接好。
  • 把“能跑”当“能交付”:没有观测、没有回滚、没有幂等,就是伪完成。