模型微调步骤

2025年3月23日

| 算法和AI

包括：

Flink 状态管理

2025年3月15日

| 原理分析

把 Flink 的状态数据、后端实现和 checkpoint 主线串起来：

先看 State 体系本身，包括 MapState、ValueState、BroadcastState 以及内部使用的 InternalKvState
再看 KeyedState 和 OperatorState 两条实现路径，以及 Heap、RocksDB、StateTable、OperatorStateBackend 这些核心组件
最后把 checkpoint 的触发、barrier 对齐、下游传播、ACK 回传和 job-manager 确认完成的过程连起来

2025年3月8日

| 原理分析

主要看 Flink 集群是怎么被创建出来、怎么和外部资源管理器打交道的，重点包括：

ClusterClientFactory -> ClusterDescriptor -> ClusterClientProvider -> ClusterClient 这条客户端侧的入口链路
AbstractContainerizedClusterClientFactory、StandaloneClientFactory 这些不同部署模式下的工厂实现
Yarn 和 Kubernetes 两条典型路径里，ResourceManager、TaskExecutor、fabric8、pod/Container 启动之间的关系

2025年3月1日

| 原理分析

重点是把“提交一个 Flink 作业”拆成几个明确阶段：

从 CLIFrontend、PackagedProgram、DefaultExecutorServiceLoader 到不同集群类型下的 PipelineExecutor
从 ExecutionEnvironment、StreamExecutionEnvironment 生成 StreamGraph / JobGraph，再交给运行时调度
再往后看 Dispatcher、JobMaster、SlotPool、TaskDeploymentDescriptor、StreamTask、Mailbox、重启策略这些运行阶段的关键组件

2025年2月22日

| 原理分析

DataStream 在运行时到底会落到哪些算子和线程模型上：

从 StreamOperator、AbstractStreamOperator、AbstractUdfStreamOperator 一路看到单输入、双输入算子的继承体系
再看 SourceFunction、SinkFunction、TwoPhaseCommitSinkFunction、ProcessFunction、KeyedProcessFunction 这些常用扩展点
最后顺着 SourceStreamTask -> StreamSource -> user function 和 StreamSink -> invoke() 这条路径，把 Watermark、TimerService、端到端一致性串起来

2025年2月15日

| 原理分析

Flink 运行时的脑图，重点包括：

Session 集群、Application 集群两种模式，以及客户端、JobManager、TaskManager 之间的基本关系
作业从提交到调度执行的主链路，包括心跳、checkpoint、slot 分配、任务状态汇报
运行时启动时会顺带拉起的组件，比如 RPC service、blob server、metric registry、HA service、heartbeat service 等

2025年2月8日

| 原理分析

Flink 逻辑计划到物理执行的主线整理，重点包括：

流任务如何先转换成 StreamGraph，批任务如何进入 OptimizedPlan，最后统一落到 JobGraph
StreamNode、StreamEdge、JobVertex、JobEdge、IntermediateDataSet 这些图结构节点和边分别代表什么
再往后如何结合并行度、算子链和调度需求，生成最终的 ExecutionGraph 并进入物理执行