项目运维规范文档
1. 项目审核会流程
目标: 确保每轮测试前所有准备工作就绪,避免因运维问题影响测试进度。
关键准备事项
- 时间安排: 每轮测试前7-10天完成环境部署。
- 需求收集: 获取导量需求、压测结果、架构图等资料。
- 环境部署: 根据导量需求和架构图,合理规划服务器数量和规格。
- QA测试支持: 协同QA和研发团队优化异常指标。
审核会内容
- 确认CDN是否采用HTTPS协议。
- 确保DMP日志接入完成。
- 说明当前服务器成本情况。
- 提示其他重大事项(如OBT计划)。
审核结果
- 运维判断环境准备状态,明确“PASS”或需改进的情况。
2. 上线前检查清单
系统配置
- 系统时钟时区校对完成。
- iptables关闭或配置允许游戏相关流量。
- SELinux关闭或调整为permissive模式。
- ulimit参数优化完成。
日志与监控
- DMP日志和快照日志接入正常,fluentd无告警。
- 分钟级error log告警配置完成。
- 数据库慢查询和errorlog告警配置完成。
- 监控系统(基础监控和服务监控)运行正常。
开服准备
- 区服最大同时在线人数明确,并能及时通知运营扩容。
- 运维、研发人员手机号码留存,确保紧急情况快速响应。
OPE后台工具
- OPE工具功能测试完成,确保开服、合服、发奖等功能正常。
其他检查项
- 官网资源(下载链接、视频、图片)走CDN且正常。
- 项目相关域名解析配置正确。
3. 项目下线流程和注意事项
步骤
数据库备份:
- 非RDS类型:关闭数据库,保留一周后彻底删除。
- RDS类型:完成快照后删除RDS实例及相关资源(安全组、参数组等)。
源码备份:
- 检查项目服务器端Git源码完整性。
- 确保客户端代码和资源在SVN服务器上完整可用。
静态资源备份:
- 备份图片等静态资源,可请求美术或项目组协助。
日志归档:
- 根据项目归属地,将日志备份至相应存储位置(OSS或S3)。
云资源清理:
- 清除EC2、RDS、LB等资源及相关配置。
- 清理CDN资源和DNS记录。
- 处理防火墙、SNS、SSL证书等项目相关配置。
其他清理工作:
- 清理TD-Agent配置。
- 确保所有费用结算完成,避免产生后续费用。
4. 云主机管理规范
腾讯云注意事项
- 新项目需创建独立私有网络,避免与已有网络冲突。
- 包月服务器使用前确认续费设置,测试环境避免自动续费。
- SSH登录优先使用密钥对,非特殊情况不使用密码。
AWS注意事项
- 启用Auto Recovery功能,默认未开启需手动配置。
- 机器到期前及时处理,防止业务中断或费用浪费。
带宽管理
- 所有云主机带宽设置上限,尤其是CDN服务器建议设为2M。
5. 数据库操作规范
MySQL参数优化
sync_binlog=0
:减少磁盘IO开销,提升性能。
6. 项目交接规范
交接内容
技术文档:
- 架构图和部署图。
- 日常运维操作手册(开服、合服等)。
- 数据库结构及主要表功能说明。
访问权限:
- 提供所有机器列表及登录方式,交接人需逐个验证。
工具使用:
- 项目自动化工具和脚本的操作方法。
问题处理:
- 整理高频率遇到的问题及解决方案。
7. 域名及SSL证书管理规范
域名管理
- 所有正式URL均需在公司域名管理系统中备案。
SSL证书更新
- 提前一个月通知项目组和运营,涉及范围包括CDN、Login、Game等服务。
- 更新完成后,确保所有相关服务配置正确。
总结
以上规范文档涵盖了游戏项目从立项到下线的全生命周期运维流程。通过遵循这些规范,可以有效提升运维效率,降低风险,并为后续项目交接和维护提供清晰指导。
评论 (0)