大连,11年后的再相见

11年后再次重游大连之游记,所到之处:

  • 东港五街、东港音乐喷泉、威尼斯水城
  • 海之韵公园、东部栈道、棒棰岛沿途海边栈道、石槽海滨浴场
  • 星海公园、星海广场、滨海路栈道、渔人码头、银沙滩
  • 俄罗斯广场、南山街、明泽湖、中山广场、西安路夜市
  • 金石滩国家地质公园
  • 旅顺博物馆、日俄监控旧址博物馆、潜艇博物馆、大连博物馆
+11

阅读全文

Volcano 笔记

按:一个任务的一生来梳理 Volcano,重点包括:

  • vcjob 提交、controller 创建 PodGroup/Podscheduler 执行 enqueue/allocate/bind,一直到 kubelet 起容器、Job Policy 处理异常、TTL 自动清理
  • QueuePodGroupgangactionplugin 这些核心概念挂到同一条主线上,方便理解调度过程
  • 补充网络拓扑感知、层级队列、在线离线混部、反调度、TDM、GPU/NPU、扩展方式、生态和运维排查
  • 最后记录一次 CRD 版本不匹配导致 vcjob 不创建 PodGroup 的真实排查过程

阅读全文

分布式系统的8大谬误

围绕分布式系统的“修好”错觉和八大谬误展开,重点包括:

  • 先讨论“分布式系统不存在修好”这句话哪些成立、哪些说得过头,并给出更准确的版本:在选定一致性模型之外,竞态只能管理
  • 解释为什么分布式系统难,不只是 CAP/FLP 这类理论边界,还有故障组合爆炸、调试困难、正确性边界滑动和人为变更
  • 逐条拆解 网络可靠延迟为零带宽无限网络安全拓扑不变只有一个管理员传输代价为零网络同质 这八大谬误
  • 最后总结这些谬误背后的共同结构,以及它们对超时、重试、幂等、批量、隔离、观测和恢复策略的直接要求

阅读全文

软件工程的演化与不变

给软件工程画一张“跨代际地图”,重点包括:

  • 用“洞察的半衰期”来区分什么值得长期深挖,什么只适合当作短期工具
  • 七代演化 梳理软件开发从硬件、结构化、对象、网络、分布式、云原生一直到 AI 时代 的复杂性迁移
  • 把不同阶段收敛到几类更底层的“永恒问题”,说明软件工程表面不断换壳,核心仍围绕复杂性、协作、抽象边界和不确定性展开
  • 最后落到工程师个体:什么在变、什么不变,为什么跨代际工程师真正稀缺,以及 AI 时代仍然需要哪些稳定的工程纪律

阅读全文

k8s扩展机制

按:Kubernetes 的扩展机制很多,理解时不要把它们看成零散插件,重点包括:

  • 节点/运行时API/调度应用/流量可观测性/安全/策略生命周期/编排新兴扩展 6 个层次梳理 30 个常见扩展点
  • CRI/CNI/CSICRD/Operator/WebhookIngress/Gateway API/Service MeshPolicy/GitOps/Workflow 挂到同一张图上,方便定位职责边界
  • 每个机制都配一个最小例子,适合做选型速查,也适合排障时快速回忆“该在哪一层动手”
  • 最后补一张总结表,帮助区分哪些扩展点主要落在 kubeletapiserverschedulercontroller 一侧

阅读全文

睡眠机制

睡眠看成生命演化打磨出来的生存机制,重点包括:

  • 按演化顺序梳理 N3 深度睡眠N1/N2 浅睡眠REM 睡眠 各自出现的先后、功能分工和生存背景
  • 解释清醒进入睡眠时的 三道核心阀门,为什么人体需要逐级降维,而不是断崖式切换
  • 分析不同睡眠阶段长期缺失各会带来什么不可替代的损伤,尤其是 N3 对大脑清理、细胞修复和整体稳态的基础作用
  • 最后把睡眠放回更大的演化视角,讨论效率、安全、寿命之间的折中,以及生命如何通过睡眠对抗熵增

阅读全文

关于塔利班的由来

借阿富汗近半个世纪的战乱,梳理塔利班的历史背景和形成路径,重点包括:

  • 1979 年苏联入侵阿富汗 讲起,说明大国干预、冷战博弈和外部资金武装如何一步步改变当地政治结构
  • 解释苏联撤军后的 权力真空、军阀混战和难民环境,为什么会给 塔利班 的崛起提供土壤
  • 回顾 基地组织、911 事件、美国入侵、20 年战争与 2021 年撤军 之间的连续关系,说明这场战争为什么最终回到原点
  • 最后讨论塔利班重新掌权后的现实僵局,以及文章想强调的一条更底层规律:武力可以短期占领,但很难长期重塑一个社会

阅读全文

分布式系统双写一致性问题

围绕 AI 平台配额管理里的“双写一致性”问题展开,重点包括:

  • 先把业务问题讲清楚:是否应该让 MySQL 中的配额账本K8s 中的真实资源占用 保持实时一致
  • FLPCAP两将军问题PACELC 这些经典理论出发,说明“跨两个独立分布式系统做实时强一致双写”为什么在理论上不可达
  • 再落到工程实践,分析提交链路、运行期和系统层故障会如何把最终一致方案推向状态机、幂等、补偿、对账和组合爆炸
  • 最后结合 Google Borg / Kubernetes / AWS 等业界做法,给出结论:放弃“实时库存式扣减”,采用 准入控制 + K8s 实时用量 的方案

阅读全文

全球市场消息队列完整指南

把主流消息队列做一次完整盘点,重点包括:

  • 先横向对比 Kafka、RabbitMQ、RocketMQ、NATS、Pulsar 五个主流产品的定位、吞吐、延迟、事务、多租户和学习曲线
  • 再分别拆解每个系统的 架构模型、核心角色、使用场景、示例代码和运维调优要点
  • 补充一些更轻量或更窄场景的方案,比如 Redis Pub/Sub、Redis Streams、PostgreSQL LISTEN/NOTIFY、MySQL 轮询、ActiveMQ
  • 最后把 AWS、Azure、Google Cloud 的托管消息服务和自建方案放在一起比较,给出选型和运维上的实际建议

阅读全文

Claude code 源码分析

顺着一次请求在 Claude Code 里的流转过程做源码拆解,重点包括:

  • 入口层运行时层引擎层工具层基础设施层 5 个层次看清整体架构和职责边界
  • QueryEngine工具调用权限系统上下文压缩MCP 集成多 Agent 协调 串成一条主线,方便理解它为什么能稳定跑长任务
  • 补充 Self-Healing MemoryFeature Flag反蒸馏挫败检测Undercover Mode 这些不那么显眼但很关键的机制
  • 最后用启动流程、核心查询流程、工具生命周期、状态管理几个视角,归纳 Claude Code 的关键数据流

阅读全文

最近文章

分类

归档

标签

RSS