lew · inference notes

GitOps 与声明式交付：仓库即真相，控制器持续对齐

Wed, 08 Apr 2026 16:00:00 +0800

GitOps 常被说成「把 Git 当数据库」，更贴近工程的说法是：Git 仓库里的声明式描述是期望状态，集群里的控制器不断对齐当前状态与期望状态。

日常开发里，我怎样和 AI 工具协作

Wed, 08 Apr 2026 11:00:00 +0800

这篇不写具体产品排行榜——各家迭代太快，名字半年一换。只记录几条稳定的协作原则，适用于带大模型能力的编辑器、终端助手或聊天窗口。

可观测性三件套：Metrics、Logs、Traces 在排障里怎么配合

Wed, 08 Apr 2026 09:30:00 +0800

系统上 Kubernetes 之后，服务实例变多、生命周期变短，单靠 SSH 看日志往往不够。Metrics（指标）、Logs（日志）、Traces（链路） 三者互补，目标是把「哪里慢 / 哪里错」从小时级缩到分钟级。

Kubernetes 核心对象：Pod、Workload 与 Service 的一页备忘

Mon, 06 Apr 2026 14:00:00 +0800

第一次接触 Kubernetes 时，对象名很多，但抓住三条主线会轻松很多：跑什么（Pod）、谁保证数量与健康（Workload）、怎么从集群外访问（Service）。

为什么需要 RAG：给 LLM 配一本「可随时翻的书」

Sun, 05 Apr 2026 09:15:00 +0800

RAG（Retrieval-Augmented Generation，检索增强生成）解决的是一件很朴素的事：模型记不住你公司内部的最新文档、你刚写的笔记、或闭源知识库里的细节——但它很会组织语言。RAG 的做法是：先检索相关片段，再把这些片段塞进提示里，让模型基于材料回答。

提示词工程入门：让模型更稳的四条习惯

Fri, 03 Apr 2026 14:30:00 +0800

「提示词工程」（Prompt Engineering）听起来很高大上，核心其实很简单：把需求说清楚，让模型在有限步数内逼近你要的输出。下面四条是我日常用得最多、也最容易复制给新手的习惯。

云原生是什么：从「上云」到「为云而设计」

Thu, 02 Apr 2026 10:00:00 +0800

日常语境里，「云原生」常被当成时髦口号。更贴近工程实践的理解是：让应用充分利用云平台的弹性、自动化与托管能力，而不是简单把传统部署搬到虚拟机里。

大语言模型能做什么：一份面向初学者的鸟瞰

Wed, 01 Apr 2026 10:00:00 +0800

大语言模型（Large Language Model，常简称 LLM）本质上是在海量文本上训练出来的概率模型：给定前文，预测下一个词（或子词）。听起来简单，但规模上来之后，会涌现出对话、摘要、翻译、简单推理、按格式输出等能力，因此成了近两年 AI 产品的核心引擎。