云平台下的运维体系建设工作内容.docx

上传人:b****0 文档编号:9135769 上传时间:2023-05-17 格式:DOCX 页数:6 大小:18.17KB
下载 相关 举报
云平台下的运维体系建设工作内容.docx_第1页
第1页 / 共6页
云平台下的运维体系建设工作内容.docx_第2页
第2页 / 共6页
云平台下的运维体系建设工作内容.docx_第3页
第3页 / 共6页
云平台下的运维体系建设工作内容.docx_第4页
第4页 / 共6页
云平台下的运维体系建设工作内容.docx_第5页
第5页 / 共6页
云平台下的运维体系建设工作内容.docx_第6页
第6页 / 共6页
亲,该文档总共6页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

云平台下的运维体系建设工作内容.docx

《云平台下的运维体系建设工作内容.docx》由会员分享,可在线阅读,更多相关《云平台下的运维体系建设工作内容.docx(6页珍藏版)》请在冰点文库上搜索。

云平台下的运维体系建设工作内容.docx

云平台下的运维体系建设工作内容

云平台下的运维体系建设工作内容

一、系统运维

系统运维负责IDC、网络、CDN和基础效劳的建设(LVS、NTP、DNS);负责资产治理,效劳器选型、交付和维修。

详细的工作职责如下:

IDC数据中心建设

搜集业务需求,预估以后数据中心的进展规模,从骨干网的散布,数据中心建筑,和Internet接入、网络解决防御能力、扩容能力、空间预留、外接专线能力、现场效劳支撑能力等方面评估选型数据中心。

负责数据中心的建设、现场保护工作。

网络建设

设计及计划生产网络架构,那个地址面包括:

数据中心网络架构、传输网架构、CDN网络架构等,和网络调优等日常运维工作。

LVS负载均衡和SNAT建设

LVS是整个站点架构中的流量入口,依照网络规模和业务需求,构建负载均衡集群;完成网络与业务效劳器的衔接,提供高性能、高可用的负载调度能力,和统一的网络层防解决

能力;SNAT集中提供数据中心的公网访问效劳,通过集群化部署,保证出网效劳的高性能与高可用。

CDN计划和建设

CDN工作划分为第三方和自建两部份。

成立第三方CDN的选型和调度操纵;依照业务进展趋势,计划CDN新节点建设布局;完善CDN业务及监控,保障CDN系统稳固、高效运行;分析业务加速频道的文件特性和数量,制定最优的加速策略和资源匹配;负责用户劫持等CDN日常故障排查工作。

效劳器选型、交付和保护

负责效劳器的测试选型,包括效劳器整机、部件的基础性测试和业务测试,降低整机功率,提升机架部署密度等。

结合对公司业务的了解,推行新硬件、新方案减少业务的效劳器投入规模。

负责效劳器硬件故障的诊判定位,效劳器硬件监控、健康检查工具的开发和保护。

OS、内核选型和OS相关保护工作

责整体平台的OS选型、定制和内核优化,和Patch的更新和内部版本发布;成立基础的YUM包治理和分发中心,提供常常利用包版本库;跟进日常各类OS相关故障;针对不同的业务类型,提供定向的优化支持。

资产治理

记录和治理运维相关的基础物理信息,包括数据中心、网络、机柜、效劳器、ACL、IP等各类资源信息,制定有效的流程,确保信息的准确性;开放API接口,为自动化运维提供数据支持。

基础效劳建设

业务对DNS、NTP、SYSLOG等基础效劳的依托超级高,需要设计高可用架构幸免单点,提供稳固的基础效劳。

二、应用运维

应用运维负责线

上效劳的变更、效劳状态监控、效劳容灾和数据备份等工作,对效劳进行例行排查、故障应急处置等工作。

详细的工作职责如下所述。

设计评审

在产品研发时期,参与产品设计评审,从运维的角度提出评审意见,使效劳知足运维准入的高可用要求。

效劳治理

负责制定线上业务升级变更及回滚方案,并进行变更实施。

把握所负责的效劳及效劳间关联关系、效劳依托的各类资源。

能够觉察效劳上的缺点,及时通报并推动解决。

制定效劳稳固性指标及准入标准,同时不断完善和优化程序和系统的功能、效率,提高运行质量。

完善监控内容,提高报警准确度。

在线上效劳显现故障时,第一时刻响应,对已知线上故障能按流程进行通报并按预案执行,未知故障组织相关人员联合排障。

资源治理

对各效劳的效劳器资产进行治理,梳理效劳器资源状况、数据中心散布情形、网络专线及带宽情形,能够合理利用效劳器资源,依照不同效劳的需求,分派不同配置的效劳器,确保效劳器资源的充分利用。

例行检查

制定效劳例行排查点,并非断完善。

依照制定的效劳排查点,对效劳进行按期检查。

对排查进程中觉察的问题,及时进行追查,排除可能存在的隐患。

预案治理

确信效劳所需的各项监控、系统指标的阈值或临界点,和显现该情形后的处置预案。

成立和更新效劳预案文档,并依照日常故障情形不断补充完善,提高预案完备性。

能够制定和评审各类预案,周期性进行预案演练,确保预案的可执行性。

数据备份

制定数据备份策略,按标准进行数据备份工作。

保证数据备份的可用性和完整性,按期开展数据恢复性测试。

三、数据库运维

数据库运维负责数据存储方案设计、数据库表设计、索引设计和SQL优化,对数据库进行变更、监控、备份、高可用设计等工作。

详细的工作职责如下所述。

设计评审

在产品研发初始时期,参与设计方案评审,从DBA的角度提出数据存储方案、库表设计方案、SQL开发标准、索引设计方案等,使效劳知足数据库利用的高可用、高性能要求。

容量计划

把握所负责效劳的数据库的容量上限,清楚地了解当前瓶颈点,当效劳还未抵达容量上限时,及时进行优化、分拆或扩容。

数据备份与灾备

制定数据备份与灾备策略,按期完成数据恢复性测试,保证数据备份的可用性和完整性。

数据库监控

完善数据库存活和性能监控,及时了解数据库运行状态及故障。

数据库平安

建设数据库账号体系,严格操纵账号权限与开放范围,降低误操作和数据泄露的风险;增强离线备份数据的治理,降低数据泄露的风险。

数据库高可用和性能优化

对数据库单点风险和故障设计相应的切换方案,降低故障对数据库效劳的阻碍;不断对数据库整体性能进行优化,包括新存储方案引进、硬件优化、文件系统优化、数据库优化、SQL优化等,在保障本钱不增加或少量增加的情形下,数据库能够支撑更多的业务请求。

自动化系统建设

设计开发数据库自动化运维系统,包括数据库部署、自动扩容、分库分表、权限治理、备份恢复、SQL审核和上线、故障切换等功能。

四、运维研发

运维研发负责通用的运维平台设计和研发工作,如:

资产治理、监控系统、运维平台、数据权限治理系统等。

提供各类API供运维或研发人员利用,封装更高层的自动化运维系统。

详细的工作职责如下所述。

运维平台

记录和治理效劳及其关联关系,协助运维人员自动化、流程化地完成日常运维操作,包括机械治理、重启、更名、初始化、域名治理、流量切换和故障预案实施等。

监控系统

负责监控系统的设计、开发工作,完成公司效劳器和各类网络设备的资源指标、线上业务运行指标的搜集、告警、存储、分析、展现和数据挖掘等工作,持续提高告警的及时性、准确性和智能性,增进公司效劳器资源的合理化调配。

自动化部署系统

参与部署自动化系统的开发,负责自动化部署系统所需要的基础数据和信息,负责权限治理、API开发、Web端开发。

结合云计算,研发和提供PaaS相关高可用平台,进一步提高效劳的部署速度和用户体验,提升资源利用率。

五、运维平安

运维平安负责网络、系统和业务等方面的平安加固工作,进行常规的平安扫描、渗透测试,进行平安工具和系统研发和平安事件应急处置。

详细的工作职责如下所述。

平安制度成立

依照公司内部的具体流程,制定切实可行,且行之有效的平安制度。

平安培训

按期向员工提供具有针对性的平安培训和考核,在全公司内成立平安负责人制度。

风险评估

通过黑白盒测试和检查机制,按期产生对物理网络、效劳器、业务应用、用户数据等方面的整体风险评估结果。

平安建设

依照风险评估结果,加固最薄弱的环节,包括设计平安防线、部署平安设备、及时更新补丁、防御病毒、源代码自动扫描和业务产品平安咨询等。

为了降低可能泄露数据的价值,通过加密、匿名化、混淆数据,乃至按期删除等技术手腕和流程来达到目的。

平安合规

为了知足例如支付牌照等合规性要求,平安团队承担着平安合规的对外接口人工作。

应急响应

成立平安报警系统,通过平安中心搜集第三方觉察的平安问题,组织各部门对已经觉察的平安问题进行修复、阻碍面评估、事后平安缘故追查。

运维进展进程

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经管营销 > 经济市场

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2