系统运维具体方案

发布 2022-03-09 10:35:28 阅读 3636

一、企业面临的问题。

1、缺乏集中的监控管理平台,运维管理人员无法主动掌握it平台的运**况,对主机系统、网络系统、数据库、应用系统等没有合适的手段进行监控,无法做到快速的主动预警、快速的故障定位和故障排除。

2、被动的运维管理模式导致运维人员对故障后知后觉,重复劳动多,工作强度大,最终it部门、各业务部门都不满意。

3、建立在手工基础上的巡检工作,难免有主观性强、随意性强的缺点,数据不能真实反映系统的运行状态,并且一旦岗位流动,不能保证系统维护的延续性。

4、it管理部门无法掌握现有it资源是否充分发挥了作用,系统如何配置更能满足业务发展的需要,一切都确乏科学的数据做为投资决策的依据,难免造成盲目投资、重复建设的巨大浪费。给企业带来不可弥补的经济损失。

二、运维管理系统的作用。

1、打破传统的“分散监控、分散管理”模式,通过建立一个集中的监控管理平台,实现对整个it系统的“集中管理、统一运维”。

2、打破传统的“只有在出现问题时,才能被动应对”的后知后觉的服务模式,系统通过7*24小时不间断的监控,主动发现故障隐患,及时预警,以利于及时消除隐患,防患于未然,并能迅速定位故障,及时通知,有利于快速排除故障。

3、通过建立一个集中的监控管理平台,以“全面监控、准确预警、及时通知、快速解决”的方式,记录所有监控数据,并根据需要提供分析报告,有案可查,便于进行系统的、科学的分析和总结。

4、打破传统的it部门对it资源心中无底的状况,通过统一的集中监控管理平台,管理人员能够清晰地知道现有资源的合理性,实现资源的有机整合与充分利用,以科学数据作为投资决策的依据,避免了盲目投资、重复建设造成的巨大浪费。给企业降低了成本,提高了工作效率,提升了管理质量和企业的核心竞争力。

5、打破传统的it维护只关注it元素问题。在系统中可以为您集中展现银行业务系统的各种信息,为领导及时了解业务状况及时决策提供便利。

三、运维管理系统的功能特点。

*24小时自动监控功能:将以往固定的阶段性系统巡检工作,变为系统自动的7x24小时不间断检测,可代替人工进行值守。直接提升了系统的it管理自动化程度,工作效率显著提高!

2、快速定位故障功能:将复杂的it环境按照银行业务关联方式进行整合,能直观地看到整个it系统的运行状态,及时准确的上报:是it系统出现了什么问题,导致业务出现问题;可以迅速定位故障点,直接提高了维护部门响应及处理问题的速度。

3、系统自动预警功能:通过系统7x24小时不间断检测,并根据数据进行分析,一旦情况异常,系统自动产生预警信息及时通知各位领导及管理员,为防患于未然提供强有力的帮手。

4、管理及决策功能:直观的报告式系统性能统计表,使it管理者及时了解it系统各部分的运行状况,提供的历史性能和故障数据,为it管理决策提供了科学的依据;并获得最直观的与业务有关的各种信息,为维护人员提供方便快捷的运维管理工具。

5、确保业务系统稳定性功能:保障业务的整体稳定性,提前发现网络中存在的各种潜在问题,提前处理,使故障率大大降低,网络故障时间大大减少,用户的投诉率明显减少,提升了业务服务质量,也降低了维护成本。

内网安全管理。

1、所有域用户不能随便更改桌面背景,保证公司使用带有logo的统一背景。

2、所有域用户不能运行管理员已经限制的程序。

3、所有域用户禁止使用管理员权限。

4、 配置域用户所有ie的默认设定为本企业**,保证员工打开ie可以直接访问到公司**,且用户不能自行更改主页。

5、禁止域用户使用运行,防止打开注册表等修改系统配置(管理员除外)。

6、隐藏所有用户的c盘,防止用户误删除系统文件,造成系统崩溃。

7、禁用控制面板中“添加/删除程序”,防止用户随意添加windows组件及删除软件,造成系统问题。

8、取消光盘或u盘自动**,以防止存储介质带入病毒或木马程序。

9、所有域用户禁止对ip地址进行修改。

通过组策略对ad域控制器进行设置,以实现以上内容。

监控管理。实施方案:采用卓豪公司基于itil(information technology infrastructure library信息技术基础架构库)架构的软件产品:

manageengine it 360

manageengine it 360主要功能:

利用manageengine it360,可以轻松管理关键的业务应用。它采用无**监控方法,监控应用服务器、服务器和数据库,从而降低成本,提高投资回报率。通过网络监控和带宽利用情况,管理员能够迅速排除网络性能相关的问题。

利用基于itil的服务台,系统可以自动指派问题,提高it服务水平。

1、业务服务管理。

在it资源中加入业务元素

定义依赖关系,提高故障管理和sla管理

降低应用支持和维护费用

轻松排除故障。

2、网络监控。

端到端的网络设施平台,高级故障和性能管理功能,管理wan、voip**、网络设备。

自动发现网络设备。

一系列包含设备配置的设备和接口模板。

3、服务器监控。

采用无**方式监控服务器

监控服务器负载、磁盘利用率、进程、内存利用率、磁盘i/o、服务器cpu利用率等

使it管理员确定问题的根源在于操作系统、应用还是服务器

支持linux, windows、solaris、aix、hp ux等。

4、应用监控。

监控crm应用、财务应用等业务关键应用

通过监控microsoft .net、oracl、jboss、tomcat、weblogic、websphere和sap,保证应用服务器健康状况和可用性

监测和诊断应用服务器及其服务出现的问题,保证正常运行。

5、数据库监控。

监控包括oracle、ms sql、sybase、ibm db2 和mysql的异构数据库服务器环境

数据库管理员可以规划资源需求,及时排除故障

数据库大小、缓存大小、数据库连接时间标签,方便查看。

6、带宽监控。

从支持netflow的设备直接导出netflow,详细了解网络中带宽使用情况

查看带宽使用图样,生成报表,无需部署硬件探针,节约成本

深入了解网络流量及其模式

实时掌握网络状况,以及流量如何影响网络总体健康状况。

7、it资产管理

硬件和软件资产的完整清单。

通过无**方式的扫描,跟踪资产的所有关系和历史。

计划性的资产审计。

快速确定资产与业务服务或其它资产的依赖关系。

跟踪企业中软件的使用情况

监视软件许可。

8、基于itil的服务台。

集成服务台,从一个位置管理所有交流

基于itil的服务台包括事件管理、问题管理、变更管理和配置管理

包括解决方案(知识库)模块,便于解决常见问题

能够将系统告警在服务台自动转化成工单

自动将工单指派给相关技术员或技术组。

9、性能报表。

界面简洁直观

能够对每个监控的属性生成报表

计划自动邮寄报表。

报表可导出为pdf、csv或xls格式文件。

可查看过去一周或一个月的历史数据。

manageengine it 360产品属于软件套件,内含不同的软件以实现不同的功能。下面将以其中之一软件opmanager为例,说明其职能。

灾难管理。需求分析:

公司现有信息平台承载着各种服务独立应用,包括:dhcp、dns、ad、oa、sap等,这些应用需要独立系统来控制保障安全可靠。未来随着企业的发展,将会增加web、sql、mail 等平台服务。

传统解决方案及分析:

传**立的系统平台方式为了保障安全,基本上是一个应用系统对应一台服务器,如果两种应用配置在一台服务器上可能会造成业务冲突,或者一种应用由于宕机或者病毒等故障造成所有应用的停止。为了采用应用系统连续性的双机热备系统,则需要一台服务器闲置作为standby 服务器。

传统服务器解决方案的有诸多弊端:

1)运营和维护成本高。

服务器大大增加了对数据中心空间、机柜、网线、耗电量、冷气空调和人力等成本需求。

2)服务器利用率低。

像dhcp、dns、ad、oa、sap应用对服务器的cpu、内存的使用率都极低,特别是对于目前多核高性能cpu的服务器时代,有的甚至长年不会达到3-5%,绝大多数系统资源利用率通常不足15%。

3)it 服务水平差,不能快速响应业务需求。

服务器的硬件维护需要宕机,某些重要应用被排除在了灾难恢复的范围之外,或者有些灾难恢复时间过长,服务器与老的操作系统或者业务之间存在兼容性,诸如此类等问题都会影响it 服务水平,从而使得公司办公效率降低。

4)系统扩展性差。

当有新的应用系统时候,不能及时部署,需要申请购买新的服务器。

这些问题直接导致it 总拥有成本(tco)升高,it 投资回报率下降,系统可管理性降低,运营效率与响应速度降低。而服务器虚拟化技术正是解决这些问题的一个好方法,运用虚拟化技术,不仅可以大大降低tco、提高运营效率、提高服务水平,而且虚拟化软件本身还为您提供高可用性和负载均衡特性,保证客户应用的连续性。

虚拟化概念简介:

服务器虚拟化是在服务器上安装一个虚拟机监控器(virtual machinemonitor,vmm)软件,将服务器物理的cpu、内存、网卡和硬盘等资源抽象出来,映射成若干个虚拟的cpu、内存、网卡和硬盘,构成虚拟机,每个虚拟机上可运行一个独立的操作系统和若干应用软件。虚拟机的产生打破了操作系统和硬件的互相依赖性,屏蔽了硬件平台的动态性、分布性和异构性,实现了硬件资源的共享和复用,提供多个独立的、隔离的应用环境。虚拟化有如下四大特性:

1)分区:在单一物理服务器上,可以同时运行多个虚拟机;

2)隔离:在同一台虚拟机服务器上运行的多个虚拟机实例彼此完全隔离,互不影响,任何虚拟机的故障,包括病毒感染、黑客攻击等,都不会影响其他的虚拟机。

3)封装:虚拟机将硬件配置、操作系统、以及应用等整个系统封装在文件里。封装特性为虚拟机应用带来了极大的方便性。

4)硬件独立:一个虚拟机可以在其他虚拟机服务器上不加任何修饰的运行,降低了软件对硬件的依赖性。

建设目标:1) 先进性。

选择当今先进的存储技术和存储设备,保证在今后数年的技术先进性,整个系统的生命周期应有比较长的时间,在系统建成以后比较长的一段时间内能满足需求增长的需要。

IT系统运维部制度考核方案 试行稿

信息服务中心系统运维部制度考核方案。试行稿 根据信息服务中心系统维护员的岗位工作性质,为提高系统维护工作质量和工作效率,特制定以下绩效考核方案 一 适用范围。信息服务中心系统维护人员。二 考核原则 考核方法。1 制度考核方法分为个人考核与部门考核。2 考核每月进行一次,月度考核结果将直接影响个人业绩...

运维服务方案举例

委派有丰富现场领导和管理经验的维护经理担任本项目的维护经理,下设是售后维护负责人,配备技术负责人等组成一套强有力的项目管理班子。项目部在维护经理领导下,全面负责本项目从开工到完工全过程的维护管理,生产指挥调度,技术质量安全,是我公司派驻本项目维护项目上的全权 对作业层负有管理与服务的职能,以确保本项...

2019IT运维服务支撑系统规范

2011 it运维服务规范。一 总则 2 二 参考标准 2 三 术语 定义和缩略语 3 3.1.术语和定义 3 3.1.1 it运维服务 3 3.1.2 it运维服务管理流程 3 3.1.3 it运维服务支撑系统 3 3.2.略语 3 四 编制原则和方法 4 五 it运维服务管理体系 4 5.1 i...