运维管理规范

行云流水
2025-05-22 / 0 评论 / 12 阅读 / 正在检测是否收录...

项目运维规范文档

规范

1. 项目审核会流程

目标: 确保每轮测试前所有准备工作就绪,避免因运维问题影响测试进度。

关键准备事项

  • 时间安排: 每轮测试前7-10天完成环境部署。
  • 需求收集: 获取导量需求、压测结果、架构图等资料。
  • 环境部署: 根据导量需求和架构图,合理规划服务器数量和规格。
  • QA测试支持: 协同QA和研发团队优化异常指标。

审核会内容

  • 确认CDN是否采用HTTPS协议。
  • 确保DMP日志接入完成。
  • 说明当前服务器成本情况。
  • 提示其他重大事项(如OBT计划)。

审核结果

  • 运维判断环境准备状态,明确“PASS”或需改进的情况。

2. 上线前检查清单

系统配置

  • 系统时钟时区校对完成。
  • iptables关闭或配置允许游戏相关流量。
  • SELinux关闭或调整为permissive模式。
  • ulimit参数优化完成。

日志与监控

  • DMP日志和快照日志接入正常,fluentd无告警。
  • 分钟级error log告警配置完成。
  • 数据库慢查询和errorlog告警配置完成。
  • 监控系统(基础监控和服务监控)运行正常。

开服准备

  • 区服最大同时在线人数明确,并能及时通知运营扩容。
  • 运维、研发人员手机号码留存,确保紧急情况快速响应。

OPE后台工具

  • OPE工具功能测试完成,确保开服、合服、发奖等功能正常。

其他检查项

  • 官网资源(下载链接、视频、图片)走CDN且正常。
  • 项目相关域名解析配置正确。

3. 项目下线流程和注意事项

步骤

  1. 数据库备份:

    • 非RDS类型:关闭数据库,保留一周后彻底删除。
    • RDS类型:完成快照后删除RDS实例及相关资源(安全组、参数组等)。
  2. 源码备份:

    • 检查项目服务器端Git源码完整性。
    • 确保客户端代码和资源在SVN服务器上完整可用。
  3. 静态资源备份:

    • 备份图片等静态资源,可请求美术或项目组协助。
  4. 日志归档:

    • 根据项目归属地,将日志备份至相应存储位置(OSS或S3)。
  5. 云资源清理:

    • 清除EC2、RDS、LB等资源及相关配置。
    • 清理CDN资源和DNS记录。
    • 处理防火墙、SNS、SSL证书等项目相关配置。
  6. 其他清理工作:

    • 清理TD-Agent配置。
    • 确保所有费用结算完成,避免产生后续费用。

4. 云主机管理规范

腾讯云注意事项

  • 新项目需创建独立私有网络,避免与已有网络冲突。
  • 包月服务器使用前确认续费设置,测试环境避免自动续费。
  • SSH登录优先使用密钥对,非特殊情况不使用密码。

AWS注意事项

  • 启用Auto Recovery功能,默认未开启需手动配置。
  • 机器到期前及时处理,防止业务中断或费用浪费。

带宽管理

  • 所有云主机带宽设置上限,尤其是CDN服务器建议设为2M。

5. 数据库操作规范

MySQL参数优化

  • sync_binlog=0:减少磁盘IO开销,提升性能。

6. 项目交接规范

交接内容

  1. 技术文档:

    • 架构图和部署图。
    • 日常运维操作手册(开服、合服等)。
    • 数据库结构及主要表功能说明。
  2. 访问权限:

    • 提供所有机器列表及登录方式,交接人需逐个验证。
  3. 工具使用:

    • 项目自动化工具和脚本的操作方法。
  4. 问题处理:

    • 整理高频率遇到的问题及解决方案。

7. 域名及SSL证书管理规范

域名管理

  • 所有正式URL均需在公司域名管理系统中备案。

SSL证书更新

  • 提前一个月通知项目组和运营,涉及范围包括CDN、Login、Game等服务。
  • 更新完成后,确保所有相关服务配置正确。

总结

以上规范文档涵盖了游戏项目从立项到下线的全生命周期运维流程。通过遵循这些规范,可以有效提升运维效率,降低风险,并为后续项目交接和维护提供清晰指导。

评论 (0)

取消
只有登录/注册用户才可评论