分类：工作备忘

工作述职

今天进行了试用期中段工作总结述职，之前提及是试用期半年，这次述职主要应该是对过往两个月工作的一次总结回顾。我全程进行了20分钟左右的述职，产品技术主管们提问给出了两三个问题。我也顺利地回答了问题。全程我还是带着紧张和严肃的态度来对待这次述职会议的。还是得加强提升自己，争取能更好融入团队，也适应自己的工作角色。

2026 年 6 月 1 日
逐渐过渡工作状态

今天早上开了一次周会，主要内容还是上周的事情总结，本周计划。下午遇到开发环境服务器资源耗尽，导致需反复重启，进行原因诊断分析，是机器CPU和内存突然上涨，导致机器负载不堪重负，甚至连ssh都无法连接。明天详细做下分析。

2026 年 4 月 20 日
ops progress

这是一个非常典型的、同时也是最具挑战性的职场场景。您不仅要成为一个优秀的运维工程师，更要成为一个优秀的“融入者”和“流程优化者”。

由于您入职才三天，您的核心目标**不是立即做出重大改变，而是建立信任、深度学习和证明可靠性。**

我将您的目标拆分成五个维度，为您提供一份详细、可操作的“新人生存与提升路线图”。

—

## 🌟 阶段一：入职前两周（建立信任和学习期）

**目标：** 成为一个“低风险、高可靠、善于记录”的新人。

### 📝 1. 日常学习与观察（最重要的任务）

* **核心原则：** 永远不要带着假设去行动。先问、后做、再记录。

* **关键行动：**

* **绘制流程地图：** 不要只关注工具（云效DevOps、集群），要关注业务流程。比如：一次从代码提交到生产部署，完整的流程包含哪些步骤？谁的哪个操作点是瓶颈？

* **记录“例外情况”（Edge Cases）：** 运维工作的高级之处在于处理意外。当系统宕机、部署失败、出现资源抢占等情况时，**不是记录“错误”，而是记录“如何应对错误”的流程。**

* **了解“为什么”：** 为什么选择公有云，而不是私有云？为什么用云效DevOps，而不是其他工具？每一次技术选型背后的**业务或安全考量**，比任何技术知识点都重要。

### 🤝 2. 协作与人际关系（建立信任）

* **对上（上级/项目经理）：** 表现出**“求知欲”和“主动性”**。每次遇到问题，不要直接说“不知道”，而是说：“我查阅了A、B、C三方面资料，排除了可能性，目前卡在X点，请您指导。”这展示了您的思考深度。

* **对同事（技术专家）：** 保持极度的礼貌和专注。多提问“这个操作背后的最佳实践是什么？”而不是“这个操作该怎么做？”

* **对待“外包”身份：** 明确知道自己需要用**更高的可靠性和学习能力**来弥补“外包”带来的信任成本。任何一个小失误都会被放大。

—

## ⚙️ 阶段二：持续输出与流程优化（获得评价的关键）

**目标：** 从执行者（Executor）转变为思考者（Thinker）。

### 🚀 1. 工作汇报（Report Structure）

优秀的汇报不是“我做了什么”，而是“我思考了什么，并给出了什么建议”。

| 汇报维度 | 糟糕的汇报（执行记录） | 优秀的汇报（价值输出） |

| :— | :— | :— |

| **日常运维** | “完成了XX集群的补丁升级，目前运行正常。” | “根据XX补丁升级，我发现资源监控系统在高峰期会有延迟；建议在资源监控系统增加一个预警阈值的调整，以更好地应对弹性伸缩的延迟风险。” |

| **流程优化** | “我发现部署流程步骤太多，我做了个脚本来减少一些步骤。” | “目前的DevOps链路中，测试环境到预发布环境的依赖版本校验步骤过于繁琐，建议引入版本化的服务目录服务（Service Catalog），将校验逻辑上移至DevOps平台，可将部署

时间缩短15%。” |

| **问题分析** | “服务A故障了，重启后恢复了。” | “根据这次服务A的故障，经分析，其根源是由于内存泄露，且每次重启都只是临时的缓解。建议在代码层面上进行内存泄漏追踪，并在运维层面上增加更精细的资源使用监控告警。” |

### 🧠 2. 流程优化（从“修复”到“免疫”）

运维的终极目标是让系统具备**“免疫力”**。

* **痛点发现：** 找到团队最常抱怨的、最耗时的、最容易出错的重复劳动（例如：手动拉取配置、手动重启服务、跨环境配置校验）。

* **优化方向：**

1. **自动化：** 用脚本或DevOps流水线解决。

2. **标准化：** 编写SOP（标准操作流程）和Runbook（手册）。

3. **抽象化：** 将重复的逻辑提升到更高级别的工具或平台去实现（例如：不要写N个环境的配置，而是建立一个统一的配置管理中心）。

—

## 🌱 阶段三：个人成长与反馈（长期职业化）

**目标：** 将自己塑造成一个不可或缺的、能自我成长的专业人士。

### 🌐 1. 个人成长路径

* **从“操作员”到“架构理解者”：** 不要只停留在命令行操作。当遇到问题时，要回溯到它所依赖的**底层架构**（集群网络、服务网格、负载均衡、资源分配策略）。

* **扩展视野：** 将精力延伸到**安全性、成本控制和可观测性**这三个维度。

* **安全：** 如何确保云效DevOps的流水线和凭证管理是符合南方电网的安全规定的？

* **成本：** 发现资源浪费点（例如：某个测试环境闲置了但资源没关），并提出关闭建议。

* **可观测性（Observability）：** 推动引入更完善的Metrics、Tracing和Logging系统，让人一眼就能知道系统哪个环节出问题了。

### 🔄 2. 输出反馈（主动承接和消化）

* **主动寻求反馈：** 不要等绩效评估。定期找您的上级或导师说：“针对我上周在[某方面]的工作，您认为我最需要提升的地方是什么？”这展示了极高的自我驱动力。

* **总结沉淀：** 无论是在本地文档还是公司的Wiki/知识库中，一定要将学到的知识、解决的难题，以及优化的流程，**形成文档和知识沉淀。** 这不仅是证据，也是团队的财富。

—

## 🎯 总结：您应该如何做（三条黄金准则）

1. **永远具备“流程第一位”的心态：** 在南网这样的机构，一切工作都必须建立在合规、安全和流程之上。在做任何事情前，先思考：“这是否符合现有SOP？如果修改了，风险在哪里？需要谁的签字？”

2. **做“知识的倍增器”：** 您解决的每一个问题，都要转化为一份可供所有人复用的文档或工具。您的价值不在于“修复 Bug”，而在于“用系统和流程杜绝未来 Bug 的发生”。

3. **心态：先学习，再贡献，再优化。** 刚入职，您是海绵，只管吸收；稳定后，您是工程师，负责执行；积累经验后，您是架构师，负责优化和设计。

祝您工作顺利！记住，稳扎稳打，细节决定成败

2026 年 4 月 9 日
新单位第二天

今日是入职南网电动第二天，虽然进的是外包公司，但仍然需珍惜这份工作。领导给我们做了新人指导并见面相互认识，印象比较深的这句:还是进来后不着急着干一堆活，可以先熟悉熟悉流程。刚毕业的年轻人简单培养也能胜任运维的工作，现在是AI时代，应花更多精力做核心价值的事情，而不是把精力放在无关紧要的细枝末节上。我确实应该学会辨别哪些内容是更有意义。加油💪

2026 年 4 月 8 日
关于operation2026的发展

一言而蔽之： 2026 年的运维工程师，要么往上走（平台工程、架构），要么往右走（AI 能力），要么往外走（信创、FinOps）。

原地踏步，才是最危险的。

2026 年 3 月 29 日

分类： 工作备忘

工作述职

逐渐过渡工作状态

ops progress

新单位第二天

关于operation2026的发展

分类：工作备忘