ImageVerifierCode 换一换
格式:DOCX , 页数:69 ,大小:365.82KB ,
资源ID:13289971      下载积分:15 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bingdoc.com/d-13289971.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(大数据系统平台项目售后服务及运营方案.docx)为本站会员(聆听****声音)主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(发送邮件至service@bingdoc.com或直接QQ联系客服),我们立即给予删除!

大数据系统平台项目售后服务及运营方案.docx

1、大数据系统平台项目售后服务及运营方案目录大数据系统平台项目售后服务及运营方案1一、方案编制目的及原则61.1、方案制定原则6二、组织体系62.1、 项目运维工作小组62.2、 项目运维工作小组人员清单72.3、 现场应急处理工作组72.4、 运维质量分72.4.1、 运维服务质量指标82.4.2、 运维服务满意度指标9三、标准化运维流程103.1、 服务标准103.1.1、 服务工作时间103.1.2、 响应时间103.1.3、 故障恢复时间103.1.4、 保密条款103.2、 需求管理流程103.3、 变更处理流程103.4、 主动运维服务101、服务报告112、系统性能排查113、软件监

2、控124、项目风险识别125、客户回访12四、运维及驻场服务内容134.1、 健康检查134.1.1、 检查列表134.1.2、 操作系统检查174.1.3、 数据库检查184.1.4、 中间件服务检查194.1.5、 大数据相关检查204.2、 深度巡检服务20421、平台资源配置204.2.1、 自动告警234.3、 日常问题及BUG处理284.4、 信息资源调研支持294.5、 需求变更收集和反馈处理294.6、 平台小版本升级294.7、 共享交换前置区维护294.8、 资源监控与容量评估294.8.1、 实时监控294.8.2、 告警提醒304.8.3、 统计分析314.8.4、 优

3、化分析314.9、 业务上线支持324.10、 资源目录动态维护324.11、 数据维护服务324.11.1、 采集数据建模入库服务324.11.2、 数据处理(清洗、比对、转换)服务324.12、 数据交换运维服务334.12.1、 公司数据调研服务334.12.2、 公司数据目录梳理服务334.12.3、 公司的数据采集方案支持服务334.12.4、 公司的数据采集服务334.13、 数据共享运维服务334.13.1、 数据中心数据根据需求提供数据接口服务334.13.2、 公司数据需求提共享库数据服务334.14、 技术交流334.15、 技能传递服务344.16、 重大活动运维服务34

4、五、数据备份345.1、 常规备份345.1.1、 备份策略345.1.2、 备份实施365.1.3、 备份文件验证375.1.4、 恢复实施385.1.5、 存储空间估算385.2、 容灾备份40521、相关概念说明405.2.1、 应用系统容灾目标405.2.2、 应用系统容灾需求分析415.2.3、 MySQL数据库容灾实现方案43525、应用程序容灾实现方案45526、应用系统灾备恢复预案485.2.7、 容灾建设资源需求清单49六、安全密钥处置管理496.1、 管理机制简述与建议49(一)工程阶段49(二)后续建议496.2、 业务系统访问账号管理496.3、 服务器访问账号管理50

5、6.4、 数据库访问账号管理516.5、 账号变更及密钥变更管理51七、技术支持527.1、 专家保障527.2、 电话咨询527.3、 远程协助537.4、 现场响应53八、故障处理538.1、 业务SLA定级548.2、 故障级别548.3、 故障处理流程55831、处理故障需注意以下事项55832、故障为以下问题的处理流程55九、应急保障569.1、 现场应急处理569.2、 系统应急保障57921、机房故障579.2.2、 电源故障57923、设备故障57924、主备倒换故障58925、安全攻击59926、系统卡顿60927、平台无法登录60928、附件无法上传下载60929、API网

6、关故障619.3、 数据应急保障629.3.2、 误删数据629.3.3、 库表资源异常639.3.4、 部门数据交换异常639.4、 网络应急保障649.4.2、 网络故障649.5、 报告与总结64十、护航保障措施6410.1、 本地化服务6410.2、 组织及人员保障6410.3、 必备资料6510.4、 数据保障6510.5、 安全条款6510.6、 宣传、培训和演习6510.7、 定期巡检6610.8、 服务监督66十一、服务报告6711.1、 周报6711.2、 月报6711.3、 季报6711.4、 年报6711.5、 运维例会67十二、运维进度安排67十三、运维涉及表单6813

7、.1、 客户需求确认单6813.2、 客户需求评估单6913.3、 需求变更申请单6913.4、 需求变更实施单7013.5、 客户需求结案单7113.6、 故障分析报告7113.7、 现场维护确认单7213.8、 服务器巡检报告7313.9、 培训签到表7313.10、 季度/年度维护服务总结报告7313.11、 客户拜访单73一、方案编制目的及原则确保各公司办公系统信息安全和数据安全,提高应对突发事件的组织指挥能力和应急处 置能力,最大限度地预防和减少突发信息安全事件及其造成的损害,确保系统的安全畅通, 为客户提供及时、有效、稳定的服务。1.1、方案制定原则本方案主要针对应用系统、服务器及

8、数据库软件制定合理科学的维保策略。方案的制定 遵循以下原则:本项目的最终目标是保证业务系统的安全和可靠运行。包括计算机系统的可靠运行和业 务数据的安全保证,我们将动用一切有效的措施手段,力求业务系统万无一失,我们的目标 是:“非正常性停机时间为零”。重在措施:注重预防,我们将在传统的被动式服务的基础上提供主动式的服务,和客户一起做好系 统的监控维护工作。采取以预防为主的策略,把故障隐患消灭在萌芽中。服务组织,服务组织管理和流程管理是项目成功得关键。我们将在责任工程师(项目经 理)的统一调度下,指挥技术、应用、商务及服务监督人员,在售前、服务实施、售后的 各个环节紧密与客户方配合追求最佳性价比:

9、服务的级别意味着客户的成本,我们在保障高标准服务的前提下,努力通过精心组织、 精心实施来降低客户的成本,同时为客户提供更多的增值服务。二、组织体系2.1、 项目运维工作小组成立项目运维工作小组,团队成员不少于10人。组长由运维部主管工程师担任,指定为项目售后服务接口人。副组长由开发部、实施部各相关部门技术骨干担任。成员公司由项目开发组成员,项目实施组成员等组成。小组的职责:负责系统运行维护管理工作;研究制定系统信息安全应急处置工作的规划、 计划和政策;协调推进系统信息安全应急机制和工作体系建设;指导协调各类应急工作组开 展对信息安全突发事件的应急响应与处置工作;对系统信息安全事件的响应作出正确

10、的判断 和决策等。根据项目特点决定驻场人员个数,驻场人员不少于4人,负责驻点运维工作,包括相应 系统的管理和运维,运维人员提供工作日5*8小时的现场驻场服务,严格按客户的工作日要 求进行出勤。2.2、 项目运维工作小组人员清单无2.3、 现场应急处理工作组现场应急处理工作组,在出现安全事件后,对计算机系统和网络安全事件的处理提供技 术支持和指导,遵循正确的流程,采取正确快速的行动作出响应,提出事件统计分析报告。现场应急处理工作组由以下各方面的人员组成:管理方面包含项目经理,以及相关成员、部门负责人。主要确保安全策略的制定与执行; 识别网络与信息系统正常运行的主要威胁;在出现问题时决定所采取行动

11、的先后顺序;做出 关键的决定;批准例外的特殊情况等。技术方面应包含开发部技术人员,实施部技术人员等主要负责从技术方面处理发生问题 的系统;检测入侵事件,并采取技术手段来降低损失。2.4、 运维质量分共享开发平台软件运维质量分由服务质量和服务满意度两部分构成,分别占有总分的 90%和10%,总分100分。服务质量以默认100分为基准,当出现一项不满足项进行扣分,出现多次不满足时可以 重复扣分。客户满意度以默认100分为基准,当出现一项不满足项进行扣分,出现多次不满足时可 以重复扣分。总体得分=(服务质量得分/100) X90+(客户满意度得分/100) X10。从服务质量、服务使用满意度两个角度

12、衡量,这些级别构成了以三星级为最高级,一星 级为最低级的层次结构。级另对应实际评估值区间三星90X100二星75X90一星60X75注:X为按照本方法进行评估而获取的评估分数值。2.5、 4. 1运维服务质量指标包括应用系统运维服务、数据运维服务、安全管理服务、故障应急服务4个方面,包含7个内容:共享开放平台功能维护、数据运维、数据入库与出库、信息安全管理及数据标准 制定、应急预案建立及使用机制、技术支持人员、故障及时修复机制,具体指标如下所示。服务分类服务内容扣分原则否(次)应用系统共享开放平项目组是否每日检查系统运行情况、数据库运行情况并每周、每月、每季度、合年反映项目运维情况?是,不扣分

13、;否,每次扣除1分(10分)运维服务(20 分)台功能维护(20 分)协助进行数据调研工作,完善政务资源目录;在相关平台系统的应用功能不能 适应业务需求时,运维方应及时安排技术人员进行软件功能的修改或升级。分 值10分,未完成一次扣2分。数据运维(10 分)建立数据质量和安全的防护机制。分值10分。数据质量问题未及时推进每1个扣1分。按周期备份数据,每少1次或备份数据不全扣1分。发生数据泄露,扣10分,并追究后续责任。数据运维服务(30分)数据入库与出库(20分)各委办局提交数据后,接口数据和数据库同步要求实时入库;前置机数据要在 1个工作日内完成数据入库。各委办局数据共享审批完成后,要在2个

14、工作日 内完成数据出库的相应工作。分值20分。未按时完成一次扣1分。安全管理服务(10分)信息安全管理及数据标准制定(10分)建立信息安全保障和业务流程体系,与数据处理专职团队及人员签订保密协议; 根据主流数据库及中间件技术标准,制定符合相应数据格式的统一标准。分值 10分。未签订保密协议扣5分,未制定统一标准扣5分。故障应急应急预案建建立应急预案,并在遇到紧急事件时使用应急预案。分值10分。未建立应急预服务(40分)立及使用机制(10分)案扣10分,遇紧急情况未使用应急预案一次扣2分。技术支持人员(10分)技术支持总人数应不少于4人,并应在半小时内响应。分值10分。未在半小时 内响应1次扣2

15、分。故障及时修复机制(20分)应保障共享开发平台运行平稳,如出现故障应及时修复,分值10分。每出现1 次影响委办局正常使用的故障,扣1分,在1小时内未修复的,再扣1分;每 出现1次影响项目正常使用的故障,扣5分,在半小时内未修复的,再扣2分; 出现重大故障,在1天内未修复或被资源使用方书面投诉并确认的,1次扣10 分。总体得分满分100分2. 4. 1运维服务满意度指标服务满意度指标是衡量服务提供机构服务质量的综合指标,是从甲方角度评价服务产品 或服务质量的一种指标体系,具体指标如下所示。项目服务使用满意度指标否/次运维人员服务满意度运维人员的服务态度和服务意识的满意度(10分)运维人员对事件

16、及处理问题的响应速度(10分)运维人员对系统问题诊断及处理结果满意度(10分)运维人员专业水平满意度(10分)运维人员服务管理规范性的满意度(10分)系统满意度系统稳定性满意度(10分)系统运行速度满意度(10分)系统操作方便性(10)数据服务满意度数据处理质量满意度(10)数据服务质量满意度(10)总体得分满分100分三、标准化运维流程3.1、 服务标准3.1.1、 服务工作时间项目最终验收前提供对系统提供维护服务,对已经上线运行的系统提供5*8小时运维服 务。自验收之日起提供不低于1年的现场支持服务。7*24*365电话、网站、电子邮件等方 式受理服务请求或帮助客户解决技术问题。3.1.2

17、、 响应时间现场服务时间为5*8小时,其余时间接到报修后30分钟内予以实质性响应,工程师1 小时内到达服务现场。3.1.3、 故障恢复时间一般性故障在2小时内做出故障诊断和恢复,复杂故障在4小时内恢复。3.1.4、 保密条款本公司将严格遵循保密协议,凡涉及客户的机型配置、ip地址、软件等信息不得向第三 方泄露,维护过程中如需涉及客户系统的数据信息、,必须先通过客户方认可,维护工作的数 据信息(无论是打印或介质上的数据信息)不得带离客户工作现场。3.2、 需求管理流程执行需求管理流程。3.3、 变更处理流程执行变更处理流程。34、主动运维服务在维护工作前,本公司工程师须提前24小时(紧急故障处理

18、除外)向客户项目主管提 出书面的维护申请。内容包括维护的目的、操作工程师、操作步骤、涉及系统硬件变更、涉 及系统软件变更、预计操作所需时间、申请操作所需时间等内容。待得到客户项目主管书面 批复后维护工作方能开始,且所有操作必须有客户方代表在场。如维护工作需要使用移动介质,则必须事先在本地进行病毒检查,经客户方确认方可使 用。维护操作必须事先做好操作方案并制定应急方案,必须严格掌握控制操作时间。所有操作记录须存档并长期保留。主动改进服务方向:及时发现维护人员在项目维护过程中的问题,要求改进。方式:服务报告、系统排查、软件监控、事项风险识别、客户回访。服务方式:1、服务报告每月项目刷选人员通过维护

19、事项发生的频率测算各项目所需服务报告的类型,发出 邮件通知要求不同的项目需要产生周报、月报、季报提供给客户。年终需产生年报提供 给客户。通过月报汇总近阶段项目运行情况和问题处理进展,让客户了解维护人员的工作内 容和职责。一方面让客户认可维护人员的工作;另一方面客户对项目问题进展有质疑或 工作内容有遗漏等情况,可根据月报中提供的部门管理人员的联系方式进行沟通,方便 部门及时发现问题进行协调,降低项目维护的风险。频率: 每周有5个及以上维护事项需整理周报发送给客户; 每月有5个及以上维护事项需整理月报发送给客户; 每季有3个及以上维护事项需整理季报发送给客户; 所有项目年终需整理年报发送给客户。2

20、、系统性能排查在做服务器巡检的同时排查系统中是否存在执行耗时长的语句,及时进行处理。主动排查和处理系统中存在执行慢的语句,对系统进行优化,并对此项记录整合至月报 中,提升客户体验。步骤:(1)维护人员在做服务器巡检时需检查数据库中语句的执行情况,项目的巡检 事项中除了反馈巡检报告外,还需反馈系统性能排查的结果和处理过程。 2) sql通过sql Profiler进行跟踪处理。(3)对刷选出执行时长超过3秒的语句,通过增加索性等方式先自行处理,若 没有效果,把问题在巡检事项中描述清楚,可直接把事项转给开发人员,要求开发优 化语句。(4)完成后处理后,需把跟踪出的语句、处理过程、最终结果整理在月报

21、的“监 控和排查处理”栏中。3、软件监控每天定时访问系统,一旦系统不能访问,维护负责人会在公司0A中收到邮件提醒,及 时进行处理。及时发现系统不能访问这类严重情况,争取在客户联系维护人员前就处理完成,让客户 感受到维护人员对项目的主动关注。4、项目风险识别部门经理每半个月发起部门内维护项目风险收集邮件,维护负责人罗列所有正在处理中 或已经处理完成但仍存在风险的维护事项,并根据提供的风险判断标准,描述有风险的事项, 收集后部门经理针对风险事项安排协调。及时发现维护项目中资源协调困难、处理进度缓慢等情况,由部门经理通过沟通协调或 逐级上报等方式,控制项目风险。步骤:(1)每半月提醒人员发出邮件提醒

22、各部门对维护事项进行风险排查。(2)部门安排维护人员在2工作内把处理中维护事项和风险点进行反馈。(3)汇总人员汇总部门内维护人员反馈列表。(4)部门经理了解事项的风险点,通过提供建议、沟通协调、逐级上报等方式 控制项目风险。5、客户回访重点项目由组长或部门经理和维护负责人一起去客户现场拜访,普通项目安排条线专人 进行电话回访,了解项目的维护情况,及时调整和改进维护过程中的问题。通过客户回访,了解项目的维护情况,及时调整和改进维护过程中的问题。(1)部门安排采集重点和普通项目列表。(2)部门经理和组长对项目列表进行审核,对重点项目安排好去现场的人员和日期。(3)针对现场拜访的项目:(3.(1)

23、负责人登记“拜访”类维护事项,跟组长或部门经理一起去现场拜访。(3.(2) 拜访需登记现场签单,完成后拍照上传至对应事项。(3.(3) 现场拜访采集到的问题,发出相关事项跟进处理。若有新增需求 发邮件提醒商务并安排开发人员进行评估。四、运维及驻场服务内容4.1 、健康检查对应用系统和部署应用系统的服务器每一个月进行一次巡检,对应用软件自身的风险进 行排查处理,对第三方的设备导致业务系统的风险,提出相应的建议和改进方案,巡检结束 后提供巡检报告。巡检报告期提供给客户负责人,客户对于巡检报告的任何疑问可以联 系项目负责人。序 号检查点是否必要检查类型完成状态一.操作系统相关Linux系统1服务器启

24、用系统防火墙必要人工2服务器时间设置同步开启必要人工3查看系统时间是否正常(特别是内网服务器,无法同步时间的情况)必要人工4查看计划任务,是否有非公司业务任务可选人工5检查监听端口,查看是否有非公司业务端口可选人工6检查进程,查看是否有可疑进程可选人工7检查登录信息可选人工8检查passwd文件,查看是否有可疑用户可选人工9sudoer中是否有可疑用户可选人工10root密码策略是否包含字母大小写、数字、特殊字符和长度大于8位必要人工11设置密码最大尝试次数及超过错误次数封禁策略必要人工12root密码过期天数设置可选人工13检查/etc/hosts文件,是否被篡改可选人工14系统端口开放必要

25、(红线)人工二,数据库相关MySQL15检查服务器是否为linux必要人工16限制MySQL的访问IP来源,只允许业务服务器才能通过网络连接必要人工17修改MySQL的默认端口必要人工18检查MySQL是否以mysql用户进行启动必要人工19检查mysql用户的权限,仅对mysql的datadir有权限必要人工20检查mysql用户的权限,不能以普通用户的方式登录系统必要人工21检查MySQL的root账号是否可以被远程访问,除了 MHA Manager服务器和监控服务器以 外,禁止root用户远程登录必要人工22检查/etc/my. cnf中是否包含密码必要人工23数据库是否开启加密可选人工

26、24数据库是否做了定时备份必要人工25数据库是否做了异机备份必要人工26确保业务程序的数据库连接使用普通用户权限,而非root权限必要人工27确保业务程序使用的用户权限仅在业务自己的数据库,而不能读取其他数据库必要人工28确保mysql的root密码策略是否包含字母大小写、数字、特殊字符和长度大于8位必要人工29确保业务系统的用户的密码策略是否包含字母大小写、数字、特殊字符和长度大于8位必要人工30确保数据库有完整的备份策略必要人工三.中间件相关Tomcat31检查tomcat版本必要人工32隐藏Tomcat和访问404页面时的版本信息必要人工33册!Tomcat 目录下,docs、examp

27、les hostmanager manager pspframe ROOT 应用必要人工34检查JVM是否使用server参数启动必要人工35检查服务器环境是否安装JDK环境必要人工36不可以使用多个虚拟主机部署应用必要人工37关闭war包自动部署的功能必要人工38以非root用户启动应用必要人工39tomcat下禁用不安全的http方法必要人工Nginx40检查nginx版本必要人工41禁止使用Nginx正向代理必要人工42禁止nobody对所有目录的读取权限,对网站目录的读取权限必要人工43限制访问nginx下的txt文件或则log文件必要人工44禁止列出nginx目录下的文件夹必要人工4

28、5禁止nginx在错误页面显示版本信息必要人工Redis46检查redis版本必要人工47不建议公网环境下redis直接对外提供服务必要人工48绑定网络监听的IP地址必要人工49给redis添加密码必要人工50使用非root权限启动Redis必要人工四.大数据相关51业务系统密码复杂度必要人工52业务系统双因素认证必要人工53Web安全模块必要人工54https证书必要人工55检查是否部署nginx反向代理必要人工56业务系统高可用可选人工57检查超时断开空闲会话必要人工58系统最大并发连接限制必要人工59单个用户多重并发限制必要人工60平台监控必要人工61检查业务系统JDBC连接数据库是否传输加密必要人工62检查数据交换平台JDBC连接数据库是否传输加密必要人工63Kong组件启用https必要人工64检查Kong

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2