大数据系统平台项目售后服务及运营方案.docx

上传人:聆听****声音 文档编号:13289971 上传时间:2023-06-12 格式:DOCX 页数:69 大小:365.82KB
下载 相关 举报
大数据系统平台项目售后服务及运营方案.docx_第1页
第1页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第2页
第2页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第3页
第3页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第4页
第4页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第5页
第5页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第6页
第6页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第7页
第7页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第8页
第8页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第9页
第9页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第10页
第10页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第11页
第11页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第12页
第12页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第13页
第13页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第14页
第14页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第15页
第15页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第16页
第16页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第17页
第17页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第18页
第18页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第19页
第19页 / 共69页
大数据系统平台项目售后服务及运营方案.docx_第20页
第20页 / 共69页
亲,该文档总共69页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

大数据系统平台项目售后服务及运营方案.docx

《大数据系统平台项目售后服务及运营方案.docx》由会员分享,可在线阅读,更多相关《大数据系统平台项目售后服务及运营方案.docx(69页珍藏版)》请在冰点文库上搜索。

大数据系统平台项目售后服务及运营方案.docx

大数据系统平台项目售后服务及运营方案

目录

大数据系统平台项目售后服务及运营方案 1

一、方案编制目的及原则 6

1.1、方案制定原则 6

二、组织体系 6

2.1、项目运维工作小组 6

2.2、项目运维工作小组人员清单 7

2.3、现场应急处理工作组 7

2.4、运维质量分 7

2.4.1、运维服务质量指标 8

2.4.2、运维服务满意度指标 9

三、标准化运维流程 10

3.1、服务标准 10

3.1.1、服务工作时间 10

3.1.2、响应时间 10

3.1.3、故障恢复时间 10

3.1.4、保密条款 10

3.2、需求管理流程 10

3.3、变更处理流程 10

3.4、主动运维服务 10

1、服务报告 11

2、系统性能排查 11

3、软件监控 12

4、项目风险识别 12

5、客户回访 12

四、运维及驻场服务内容 13

4.1、健康检查 13

4.1.1、检查列表 13

4.1.2、操作系统检查 17

4.1.3、数据库检查 18

4.1.4、中间件服务检查 19

4.1.5、大数据相关检查 20

4.2、深度巡检服务 20

421、平台资源配置 20

4.2.1、自动告警 23

4.3、日常问题及BUG处理 28

4.4、信息资源调研支持 29

4.5、需求变更收集和反馈处理 29

4.6、平台小版本升级 29

4.7、共享交换前置区维护 29

4.8、资源监控与容量评估 29

4.8.1、实时监控 29

4.8.2、告警提醒 30

4.8.3、统计分析 31

4.8.4、优化分析 31

4.9、业务上线支持 32

4.10、资源目录动态维护 32

4.11、数据维护服务 32

4.11.1、采集数据建模入库服务 32

4.11.2、数据处理(清洗、比对、转换)服务 32

4.12、数据交换运维服务 33

4.12.1、公司数据调研服务 33

4.12.2、公司数据目录梳理服务 33

4.12.3、公司的数据采集方案支持服务 33

4.12.4、公司的数据采集服务 33

4.13、数据共享运维服务 33

4.13.1、数据中心数据根据需求提供数据接口服务 33

4.13.2、公司数据需求提共享库数据服务 33

4.14、技术交流 33

4.15、技能传递服务 34

4.16、重大活动运维服务 34

五、数据备份 34

5.1、常规备份 34

5.1.1、备份策略 34

5.1.2、备份实施 36

5.1.3、备份文件验证 37

5.1.4、恢复实施 38

5.1.5、存储空间估算 38

5.2、容灾备份 40

521、相关概念说明 40

5.2.1、应用系统容灾目标 40

5.2.2、应用系统容灾需求分析 41

5.2.3、MySQL数据库容灾实现方案 43

525、应用程序容灾实现方案 45

526、应用系统灾备恢复预案 48

5.2.7、容灾建设资源需求清单 49

六、安全密钥处置管理 49

6.1、管理机制简述与建议 49

(一)工程阶段 49

(二)后续建议 49

6.2、业务系统访问账号管理 49

6.3、服务器访问账号管理 50

6.4、数据库访问账号管理 51

6.5、账号变更及密钥变更管理 51

七、技术支持 52

7.1、专家保障 52

7.2、电话咨询 52

7.3、远程协助 53

7.4、现场响应 53

八、故障处理 53

8.1、业务SLA定级 54

8.2、故障级别 54

8.3、故障处理流程 55

831、处理故障需注意以下事项 55

832、故障为以下问题的处理流程 55

九、应急保障 56

9.1、现场应急处理 56

9.2、系统应急保障 57

921、机房故障 57

9.2.2、电源故障 57

923、设备故障 57

924、主备倒换故障 58

925、安全攻击 59

926、系统卡顿 60

927、平台无法登录 60

928、附件无法上传下载 60

929、API网关故障 61

9.3、数据应急保障 62

9.3.2、误删数据 62

9.3.3、库表资源异常 63

9.3.4、部门数据交换异常 63

9.4、网络应急保障 64

9.4.2、网络故障 64

9.5、报告与总结 64

十、护航保障措施 64

10.1、本地化服务 64

10.2、组织及人员保障 64

10.3、必备资料 65

10.4、数据保障 65

10.5、安全条款 65

10.6、宣传、培训和演习 65

10.7、定期巡检 66

10.8、服务监督 66

十一、服务报告 67

11.1、周报 67

11.2、月报 67

11.3、季报 67

11.4、年报 67

11.5、运维例会 67

十二、运维进度安排 67

十三、运维涉及表单 68

13.1、客户需求确认单 68

13.2、客户需求评估单 69

13.3、需求变更申请单 69

13.4、需求变更实施单 70

13.5、客户需求结案单 71

13.6、故障分析报告 71

13.7、现场维护确认单 72

13.8、服务器巡检报告 73

13.9、培训签到表 73

13.10、季度/年度维护服务总结报告 73

13.11、客户拜访单 73

一、方案编制目的及原则

确保各公司办公系统信息安全和数据安全,提高应对突发事件的组织指挥能力和应急处置能力,最大限度地预防和减少突发信息安全事件及其造成的损害,确保系统的安全畅通,为客户提供及时、有效、稳定的服务。

1.1、方案制定原则

本方案主要针对应用系统、服务器及数据库软件制定合理科学的维保策略。

方案的制定遵循以下原则:

本项目的最终目标是保证业务系统的安全和可靠运行。

包括计算机系统的可靠运行和业务数据的安全保证,我们将动用一切有效的措施手段,力求业务系统万无一失,我们的目标是:

“非正常性停机时间为零”。

重在措施:

注重预防,我们将在传统的被动式服务的基础上提供主动式的服务,和客户一起做好系统的监控维护工作。

采取以预防为主的策略,把故障隐患消灭在萌芽中。

服务组织,服务组织管理和流程管理是项目成功得关键。

我们将在责任工程师(项目经理)的统一调度下,指挥技术、应用、商务及服务监督人员,在售前、服务实施、售后的各个环节紧密与客户方配合

追求最佳性价比:

服务的级别意味着客户的成本,我们在保障高标准服务的前提下,努力通过精心组织、精心实施来降低客户的成本,同时为客户提供更多的增值服务。

二、组织体系

2.1、项目运维工作小组

成立项目运维工作小组,团队成员不少于10人。

组长由运维部主管工程师担任,指定为项目售后服务接口人。

副组长由开发部、实施部各相关部门技术骨干担任。

成员公司由项目开发组成员,项目实施组成员等组成。

小组的职责:

负责系统运行维护管理工作;研究制定系统信息安全应急处置工作的规划、计划和政策;协调推进系统信息安全应急机制和工作体系建设;指导协调各类应急工作组开展对信息安全突发事件的应急响应与处置工作;对系统信息安全事件的响应作出正确的判断和决策等。

根据项目特点决定驻场人员个数,驻场人员不少于4人,负责驻点运维工作,包括相应系统的管理和运维,运维人员提供工作日5*8小时的现场驻场服务,严格按客户的工作日要求进行出勤。

2.2、项目运维工作小组人员清单

2.3、现场应急处理工作组

现场应急处理工作组,在出现安全事件后,对计算机系统和网络安全事件的处理提供技术支持和指导,遵循正确的流程,采取正确快速的行动作出响应,提出事件统计分析报告。

现场应急处理工作组由以下各方面的人员组成:

管理方面包含项目经理,以及相关成员、部门负责人。

主要确保安全策略的制定与执行;识别网络与信息系统正常运行的主要威胁;在出现问题时决定所采取行动的先后顺序;做出关键的决定;批准例外的特殊情况等。

技术方面应包含开发部技术人员,实施部技术人员等主要负责从技术方面处理发生问题的系统;检测入侵事件,并采取技术手段来降低损失。

2.4、>运维质量分

共享开发平台软件运维质量分由服务质量和服务满意度两部分构成,分别占有总分的90%和10%,总分100分。

服务质量以默认100分为基准,当出现一项不满足项进行扣分,出现多次不满足时可以重复扣分。

客户满意度以默认100分为基准,当出现一项不满足项进行扣分,出现多次不满足时可以重复扣分。

总体得分=(服务质量得分/100)X90+(客户满意度得分/100)X10。

从服务质量、服务使用满意度两个角度衡量,这些级别构成了以三星级为最高级,一星级为最低级的层次结构。

级另

对应实际评估值区间

三星★★★

90≤X<100

二星★★

75≤X<90

一星★

60≤X<75

注:

X为按照本方法进行评估而获取的评估分数值。

2.5、4.1运维服务质量指标

包括应用系统运维服务、数据运维服务、安全管理服务、故障应急服务4个方面,包含

7个内容:

共享开放平台功能维护、数据运维、数据入库与出库、信息安全管理及数据标准制定、应急预案建立及使用机制、技术支持人员、故障及时修复机制,具体指标如下所示。

服务分类

服务内容

扣分原则

否(次)

应用系统

共享开放平

项目组是否每日检查系统运行情况、数据库运行情况并每周、每月、每季度、合

年反映项目运维情况?

是,不扣分;否,每次扣除1分(10分)

运维服务

(20分)

台功能维护

(20分)

协助进行数据调研工作,完善政务资源目录;在相关平台系统的应用功能不能适应业务需求时,运维方应及时安排技术人员进行软件功能的修改或升级。

分值10分,未完成一次扣2分。

数据运维

(10分)

建立数据质量和安全的防护机制。

分值10分。

数据质量问题未及时推进每1个

扣1分。

按周期备份数据,每少1次或备份数据不全扣1分。

发生数据泄露,

扣10分,并追究后续责任。

数据运维

服务(30

分)

数据入库与

出库(20分)

各委办局提交数据后,接口数据和数据库同步要求实时入库;前置机数据要在1个工作日内完成数据入库。

各委办局数据共享审批完成后,要在2个工作日内完成数据出库的相应工作。

分值20分。

未按时完成一次扣1分。

安全管理

服务(10

分)

信息安全管

理及数据标

准制定(10

分)

建立信息安全保障和业务流程体系,与数据处理专职团队及人员签订保密协议;根据主流数据库及中间件技术标准,制定符合相应数据格式的统一标准。

分值10分。

未签订保密协议扣5分,未制定统一标准扣5分。

故障应急

应急预案建

建立应急预案,并在遇到紧急事件时使用应急预案。

分值10分。

未建立应急预

服务(40

分)

立及使用机

制(10分)

案扣10分,遇紧急情况未使用应急预案一次扣2分。

技术支持人

员(10分)

技术支持总人数应不少于4人,并应在半小时内响应。

分值10分。

未在半小时内响应1次扣2分。

故障及时修

复机制(20

分)

应保障共享开发平台运行平稳,如出现故障应及时修复,分值10分。

每出现1次影响委办局正常使用的故障,扣1分,在1小时内未修复的,再扣1分;每出现1次影响项目正常使用的故障,扣5分,在半小时内未修复的,再扣2分;出现重大故障,在1天内未修复或被资源使用方书面投诉并确认的,1次扣10分。

总体得分

满分100分

2.4.1运维服务满意度指标

服务满意度指标是衡量服务提供机构服务质量的综合指标,是从甲方角度评价服务产品或服务质量的一种指标体系,具体指标如下所示。

项目

服务使用满意度指标

否/次

运维人员服务满意度

运维人员的服务态度和服务意识的满意度(10分)

运维人员对事件及处理问题的响应速度(10分)

运维人员对系统问题诊断及处理结果满意度(10分)

运维人员专业水平满意度(10分)

运维人员服务管理规范性的满意度(10分)

系统满意度

系统稳定性满意度(10分)

系统运行速度满意度(10分)

系统操作方便性(10)

数据服务满意度

数据处理质量满意度(10)

数据服务质量满意度(10)

总体得分

满分100分

三、标准化运维流程

3.1、服务标准

3.1.1、服务工作时间

项目最终验收前提供对系统提供维护服务,对已经上线运行的系统提供5*8小时运维服务。

自验收之日起提供不低于1年的现场支持服务。

7*24*365电话、网站、电子邮件等方式受理服务请求或帮助客户解决技术问题。

3.1.2、响应时间

现场服务时间为5*8小时,其余时间接到报修后30分钟内予以实质性响应,工程师1小时内到达服务现场。

3.1.3、故障恢复时间

一般性故障在2小时内做出故障诊断和恢复,复杂故障在4小时内恢复。

3.1.4、保密条款

本公司将严格遵循保密协议,凡涉及客户的机型配置、ip地址、软件等信息不得向第三方泄露,维护过程中如需涉及客户系统的数据信息、,必须先通过客户方认可,维护工作的数据信息(无论是打印或介质上的数据信息)不得带离客户工作现场。

3.2、需求管理流程

执行需求管理流程。

3.3、变更处理流程

执行变更处理流程。

3・4、主动运维服务

在维护工作前,本公司工程师须提前24小时(紧急故障处理除外)向客户项目主管提出书面的维护申请。

内容包括维护的目的、操作工程师、操作步骤、涉及系统硬件变更、涉及系统软件变更、预计操作所需时间、申请操作所需时间等内容。

待得到客户项目主管书面批复后维护工作方能开始,且所有操作必须有客户方代表在场。

如维护工作需要使用移动介质,则必须事先在本地进行病毒检查,经客户方确认方可使用。

维护操作必须事先做好操作方案并制定应急方案,必须严格掌握控制操作时间。

所有操作记录须存档并长期保留。

主动改进服务方向:

及时发现维护人员在项目维护过程中的问题,要求改进。

方式:

服务报告、系统排查、软件监控、事项风险识别、客户回访。

服务方式:

1、服务报告

每月项目刷选人员通过维护事项发生的频率测算各项目所需服务报告的类型,发出邮件通知要求不同的项目需要产生周报、月报、季报提供给客户。

年终需产生年报提供给客户。

通过月报汇总近阶段项目运行情况和问题处理进展,让客户了解维护人员的工作内容和职责。

一方面让客户认可维护人员的工作;另一方面客户对项目问题进展有质疑或工作内容有遗漏等情况,可根据月报中提供的部门管理人员的联系方式进行沟通,方便部门及时发现问题进行协调,降低项目维护的风险。

频率:

♦每周有5个及以上维护事项需整理周报发送给客户;

♦每月有5个及以上维护事项需整理月报发送给客户;

♦每季有3个及以上维护事项需整理季报发送给客户;

♦所有项目年终需整理年报发送给客户。

2、系统性能排查

在做服务器巡检的同时排查系统中是否存在执行耗时长的语句,及时进行处理。

主动排查和处理系统中存在执行慢的语句,对系统进行优化,并对此项记录整合至月报中,提升客户体验。

步骤:

(1)维护人员在做服务器巡检时需检查数据库中语句的执行情况,项目的巡检事项中除了反馈巡检报告外,还需反馈系统性能排查的结果和处理过程。

♦2)sql通过sqlProfiler进行跟踪处理。

(3)对刷选出执行时长超过3秒的语句,通过增加索性等方式先自行处理,若没有效果,把问题在巡检事项中描述清楚,可直接把事项转给开发人员,要求开发优化语句。

(4)完成后处理后,需把跟踪出的语句、处理过程、最终结果整理在月报的“监控和排查处理”栏中。

3、软件监控

每天定时访问系统,一旦系统不能访问,维护负责人会在公司0A中收到邮件提醒,及时进行处理。

及时发现系统不能访问这类严重情况,争取在客户联系维护人员前就处理完成,让客户感受到维护人员对项目的主动关注。

4、项目风险识别

部门经理每半个月发起部门内维护项目风险收集邮件,维护负责人罗列所有正在处理中或已经处理完成但仍存在风险的维护事项,并根据提供的风险判断标准,描述有风险的事项,收集后部门经理针对风险事项安排协调。

及时发现维护项目中资源协调困难、处理进度缓慢等情况,由部门经理通过沟通协调或逐级上报等方式,控制项目风险。

步骤:

(1)每半月提醒人员发出邮件提醒各部门对维护事项进行风险排查。

(2)部门安排维护人员在2工作内把处理中维护事项和风险点进行反馈。

(3)汇总人员汇总部门内维护人员反馈列表。

(4)部门经理了解事项的风险点,通过提供建议、沟通协调、逐级上报等方式控制项目风险。

5、客户回访

重点项目由组长或部门经理和维护负责人一起去客户现场拜访,普通项目安排条线专人进行电话回访,了解项目的维护情况,及时调整和改进维护过程中的问题。

通过客户回访,了解项目的维护情况,及时调整和改进维护过程中的问题。

(1)部门安排采集重点和普通项目列表。

(2)部门经理和组长对项目列表进行审核,对重点项目安排好去现场的人员和

日期。

(3)针对现场拜访的项目:

(3.

(1)负责人登记“拜访”类维护事项,跟组长或部门经理一起去现场

拜访。

(3.

(2)拜访需登记现场签单,完成后拍照上传至对应事项。

(3.(3)现场拜访采集到的问题,发出相关事项跟进处理。

若有新增需求发邮件提醒商务并安排开发人员进行评估。

四、运维及驻场服务内容

4.1、健康检查

对应用系统和部署应用系统的服务器每一个月进行一次巡检,对应用软件自身的风险进行排查处理,对第三方的设备导致业务系统的风险,提出相应的建议和改进方案,巡检结束后提供《巡检报告》。

巡检报告期提供给客户负责人,客户对于巡检报告的任何疑问可以联系项目负责人。

序号

检查点

是否必要

检查类

完成状

一.操作系统相关

Linux系统

1

服务器启用系统防火墙

必要

人工

2

服务器时间设置同步开启

必要

人工

3

查看系统时间是否正常(特别是内网服务器,无法同步时间的情况)

必要

人工

4

查看计划任务,是否有非公司业务任务

可选

人工

5

检查监听端口,查看是否有非公司业务端口

可选

人工

6

检查进程,查看是否有可疑进程

可选

人工

7

检查登录信息

可选

人工

8

检查passwd文件,查看是否有可疑用户

可选

人工

9

sudoer中是否有可疑用户

可选

人工

10

root密码策略是否包含字母大小写、数字、特殊字符和长度大于8位

必要

人工

11

设置密码最大尝试次数及超过错误次数封禁策略

必要

人工

12

root密码过期天数设置

可选

人工

13

检查/etc/hosts文件,是否被篡改

可选

人工

14

系统端口开放

必要(红

线)

人工

二,数据库相关

MySQL

15

检查服务器是否为linux

必要

人工

16

限制MySQL的访问IP来源,只允许业务服务器才能通过网络连接

必要

人工

17

修改MySQL的默认端口

必要

人工

18

检查MySQL是否以mysql用户进行启动

必要

人工

19

检查mysql用户的权限,仅对mysql的datadir有权限

必要

人工

20

检查mysql用户的权限,不能以普通用户的方式登录系统

必要

人工

21

检查MySQL的root账号是否可以被远程访问,除了MHAManager服务器和监控服务器以外,禁止root用户远程登录

必要

人工

22

检查/etc/my.cnf中是否包含密码

必要

人工

23

数据库是否开启加密

可选

人工

24

数据库是否做了定时备份

必要

人工

25

数据库是否做了异机备份

必要

人工

26

确保业务程序的数据库连接使用普通用户权限,而非root权限

必要

人工

27

确保业务程序使用的用户权限仅在业务自己的数据库,而不能读取其他数据库

必要

人工

28

确保mysql的root密码策略是否包含字母大小写、数字、特殊字符和长度大于8位

必要

人工

29

确保业务系统的用户的密码策略是否包含字母大小写、数字、特殊字符和长度大于8位

必要

人工

30

确保数据库有完整的备份策略

必要

人工

三.中间件相关

Tomcat

31

检查tomcat版本

必要

人工

32

隐藏Tomcat和访问404页面时的版本信息

必要

人工

33

册!

^Tomcat目录下,docs、examples>hostmanager>manager>pspframe>ROOT应用

必要

人工

34

检查JVM是否使用server参数启动

必要

人工

35

检查服务器环境是否安装JDK环境

必要

人工

36

不可以使用多个虚拟主机部署应用

必要

人工

37

关闭war包自动部署的功能

必要

人工

38

以非root用户启动应用

必要

人工

39

tomcat下禁用不安全的http方法

必要

人工

Nginx

40

检查nginx版本

必要

人工

41

禁止使用Nginx正向代理

必要

人工

42

禁止nobody对所有目录的读取权限,对网站目录的读取权限

必要

人工

43

限制访问nginx下的txt文件或则log文件

必要

人工

44

禁止列出nginx目录下的文件夹

必要

人工

45

禁止nginx在错误页面显示版本信息

必要

人工

Redis

46

检查redis版本

必要

人工

47

不建议公网环境下redis直接对外提供服务

必要

人工

48

绑定网络监听的IP地址

必要

人工

49

给redis添加密码

必要

人工

50

使用非root权限启动Redis

必要

人工

四.大数据相关

51

业务系统密码复杂度

必要

人工

52

业务系统双因素认证

必要

人工

53

Web安全模块

必要

人工

54

https证书

必要

人工

55

检查是否部署nginx反向代理

必要

人工

56

业务系统高可用

可选

人工

57

检查超时断开空闲会话

必要

人工

58

系统最大并发连接限制

必要

人工

59

单个用户多重并发限制

必要

人工

60

平台监控

必要

人工

61

检查业务系统JDBC连接数据库是否传输加密

必要

人工

62

检查数据交换平台JDBC连接数据库是否传输加密

必要

人工

63

Kong组件启用https

必要

人工

64

检查Kong

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 临时分类 > 批量上传

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2