分类: 工作备忘

  • 工作述职

    今天进行了试用期中段工作总结述职,之前提及是试用期半年,这次述职主要应该是对过往两个月工作的一次总结回顾。我全程进行了20分钟左右的述职,产品技术主管们提问给出了两三个问题。我也顺利地回答了问题。全程我还是带着紧张和严肃的态度来对待这次述职会议的。还是得加强提升自己,争取能更好融入团队,也适应自己的工作角色。

  • 逐渐过渡工作状态

    今天早上开了一次周会,主要内容还是上周的事情总结,本周计划。下午遇到开发环境服务器资源耗尽,导致需反复重启,进行原因诊断分析,是机器CPU和内存突然上涨,导致机器负载不堪重负,甚至连ssh都无法连接。明天详细做下分析。

  • ops progress

    这是一个非常典型的、同时也是最具挑战性的职场场景。您不仅要成为一个优秀的运维工程师,更要成为一个优秀的“融入者”和“流程优化者”。

    由于您入职才三天,您的核心目标**不是立即做出重大改变,而是建立信任、深度学习和证明可靠性。**

    我将您的目标拆分成五个维度,为您提供一份详细、可操作的“新人生存与提升路线图”。

    ## 🌟 阶段一:入职前两周(建立信任和学习期)

    **目标:** 成为一个“低风险、高可靠、善于记录”的新人。

    ### 📝 1. 日常学习与观察(最重要的任务)

    *   **核心原则:** 永远不要带着假设去行动。先问、后做、再记录。

    *   **关键行动:**

        *   **绘制流程地图:** 不要只关注工具(云效DevOps、集群),要关注业务流程。比如:一次从代码提交到生产部署,完整的流程包含哪些步骤?谁的哪个操作点是瓶颈?

        *   **记录“例外情况”(Edge Cases):** 运维工作的高级之处在于处理意外。当系统宕机、部署失败、出现资源抢占等情况时,**不是记录“错误”,而是记录“如何应对错误”的流程。**

        *   **了解“为什么”:** 为什么选择公有云,而不是私有云?为什么用云效DevOps,而不是其他工具?每一次技术选型背后的**业务或安全考量**,比任何技术知识点都重要。

    ### 🤝 2. 协作与人际关系(建立信任)

    *   **对上(上级/项目经理):** 表现出**“求知欲”和“主动性”**。每次遇到问题,不要直接说“不知道”,而是说:“我查阅了A、B、C三方面资料,排除了可能性,目前卡在X点,请您指导。”这展示了您的思考深度。

    *   **对同事(技术专家):** 保持极度的礼貌和专注。多提问“这个操作背后的最佳实践是什么?”而不是“这个操作该怎么做?”

    *   **对待“外包”身份:** 明确知道自己需要用**更高的可靠性和学习能力**来弥补“外包”带来的信任成本。任何一个小失误都会被放大。

    ## ⚙️ 阶段二:持续输出与流程优化(获得评价的关键)

    **目标:** 从执行者(Executor)转变为思考者(Thinker)。

    ### 🚀 1. 工作汇报(Report Structure)

    优秀的汇报不是“我做了什么”,而是“我思考了什么,并给出了什么建议”。

    | 汇报维度 | 糟糕的汇报(执行记录) | 优秀的汇报(价值输出) |

    | :— | :— | :— |

    | **日常运维** | “完成了XX集群的补丁升级,目前运行正常。” | “根据XX补丁升级,我发现资源监控系统在高峰期会有延迟;建议在资源监控系统增加一个预警阈值的调整,以更好地应对弹性伸缩的延迟风险。” |

    | **流程优化** | “我发现部署流程步骤太多,我做了个脚本来减少一些步骤。” | “目前的DevOps链路中,测试环境到预发布环境的依赖版本校验步骤过于繁琐,建议引入版本化的服务目录服务(Service Catalog),将校验逻辑上移至DevOps平台,可将部署

    时间缩短15%。” |

    | **问题分析** | “服务A故障了,重启后恢复了。” | “根据这次服务A的故障,经分析,其根源是由于内存泄露,且每次重启都只是临时的缓解。建议在代码层面上进行内存泄漏追踪,并在运维层面上增加更精细的资源使用监控告警。” |

    ### 🧠 2. 流程优化(从“修复”到“免疫”)

    运维的终极目标是让系统具备**“免疫力”**。

    *   **痛点发现:** 找到团队最常抱怨的、最耗时的、最容易出错的重复劳动(例如:手动拉取配置、手动重启服务、跨环境配置校验)。

    *   **优化方向:**

        1.  **自动化:** 用脚本或DevOps流水线解决。

        2.  **标准化:** 编写SOP(标准操作流程)和Runbook(手册)。

        3.  **抽象化:** 将重复的逻辑提升到更高级别的工具或平台去实现(例如:不要写N个环境的配置,而是建立一个统一的配置管理中心)。

    ## 🌱 阶段三:个人成长与反馈(长期职业化)

    **目标:** 将自己塑造成一个不可或缺的、能自我成长的专业人士。

    ### 🌐 1. 个人成长路径

    *   **从“操作员”到“架构理解者”:** 不要只停留在命令行操作。当遇到问题时,要回溯到它所依赖的**底层架构**(集群网络、服务网格、负载均衡、资源分配策略)。

    *   **扩展视野:** 将精力延伸到**安全性、成本控制和可观测性**这三个维度。

        *   **安全:** 如何确保云效DevOps的流水线和凭证管理是符合南方电网的安全规定的?

        *   **成本:** 发现资源浪费点(例如:某个测试环境闲置了但资源没关),并提出关闭建议。

        *   **可观测性(Observability):** 推动引入更完善的Metrics、Tracing和Logging系统,让人一眼就能知道系统哪个环节出问题了。

    ### 🔄 2. 输出反馈(主动承接和消化)

    *   **主动寻求反馈:** 不要等绩效评估。定期找您的上级或导师说:“针对我上周在[某方面]的工作,您认为我最需要提升的地方是什么?”这展示了极高的自我驱动力。

    *   **总结沉淀:** 无论是在本地文档还是公司的Wiki/知识库中,一定要将学到的知识、解决的难题,以及优化的流程,**形成文档和知识沉淀。** 这不仅是证据,也是团队的财富。

    ## 🎯 总结:您应该如何做(三条黄金准则)

    1.  **永远具备“流程第一位”的心态:** 在南网这样的机构,一切工作都必须建立在合规、安全和流程之上。在做任何事情前,先思考:“这是否符合现有SOP?如果修改了,风险在哪里?需要谁的签字?”

    2.  **做“知识的倍增器”:** 您解决的每一个问题,都要转化为一份可供所有人复用的文档或工具。您的价值不在于“修复 Bug”,而在于“用系统和流程杜绝未来 Bug 的发生”。

    3.  **心态:先学习,再贡献,再优化。** 刚入职,您是海绵,只管吸收;稳定后,您是工程师,负责执行;积累经验后,您是架构师,负责优化和设计。

    祝您工作顺利!记住,稳扎稳打,细节决定成败

  • 新单位第二天

    今日是入职南网电动第二天,虽然进的是外包公司,但仍然需珍惜这份工作。领导给我们做了新人指导并见面相互认识,印象比较深的这句:还是进来后不着急着干一堆活,可以先熟悉熟悉流程。刚毕业的年轻人简单培养也能胜任运维的工作,现在是AI时代,应花更多精力做核心价值的事情,而不是把精力放在无关紧要的细枝末节上。我确实应该学会辨别哪些内容是更有意义。加油💪

  • 关于operation2026的发展

    一言而蔽之: 2026 年的运维工程师,要么往上走(平台工程、架构),要么往右走(AI 能力),要么往外走(信创、FinOps)。

    原地踏步,才是最危险的。