涵盖IT资源的实时监控、数据共享、相互协调与联动,立体化、全链路、全流程监测,具备数据分析与挖掘能力,实现故障预判与工单推送、资产资源的自动调度。提高资源利用率以及管理效率,降低运维成本,主动感知IT故障,提高医护人员及患者满意度,保障业务稳定运行。
本系列文章分享一个比较新(2023y)的智慧医院建设方案,原文系某三甲医院智慧医院建设项目的真实案例,全文共200页合计约70000字,本篇介绍该整体方案中的机房运维监控系统。智慧医院建设项目文章列表:
- 智慧医院建设项目解决方案:项目背景
- 智慧医院建设项目解决方案:项目依据
- 智慧医院建设项目解决方案:建设目标、规模、内容
- 智慧医院建设项目解决方案:项目现状分析
- 智慧医院建设项目解决方案:项目需求分析
- 智慧医院建设项目解决方案:总体建设方案
- 智慧医院建设项目解决方案:医疗系统改造
- 智慧医院建设项目解决方案:医院预约平台
- 智慧医院建设项目解决方案:床旁结算系统
- 智慧医院建设项目解决方案:短信服务系统
- 智慧医院建设项目解决方案:陪护服务系统
- 智慧医院建设项目解决方案:点餐、医患沟通和诊间结算系统
- 智慧医院建设项目解决方案:医疗门户网站
- 智慧医院建设项目解决方案:互联网医院
- 智慧医院建设项目解决方案:医疗质量管理
- 智慧医院建设项目解决方案:医疗护理业务系统
- 智慧医院建设项目解决方案:急诊管理系统
- 智慧医院建设项目解决方案:分级诊疗平台
- 智慧医院建设项目解决方案:医务管理平台
- 智慧医院建设项目解决方案:随访管理和院感监控系统
- 智慧医院建设项目解决方案:临床路径管理系统
- 智慧医院建设项目解决方案:病案管理系统
- 智慧医院建设项目解决方案:临床决策支撑与信息平台
- 智慧医院建设项目解决方案:综合运营管理平台
- 智慧医院建设项目解决方案:物流管理系统规划
- 智慧医院建设项目解决方案:人事与财务管理系统规划
- 智慧医院建设项目解决方案:输液管理与ICU探视系统
- 智慧医院建设项目解决方案:CA数字签名系统
- 智慧医院建设项目解决方案:机房运维监控系统
- 智慧医院建设项目解决方案:项目管理、系统集成、系统培训
- 智慧医院建设项目解决方案:驻场运维服务
- 智慧医院建设项目解决方案:评价咨询服务
- 智慧医院建设项目解决方案:统一售后服务
1 机房运维监控系统
采用Hadoop+hbase+dubbo大数据架构,实现基础设施集中监控,主要涵盖网络设备、安全设备、无线资源、服务器、主机、存储、虚拟化、数据库、中间件、安防视频、机房动环等相关IT资源,全面直观展示各资源运行状态;结合各类型日志、流量、进程、端口等数据,精准定位,分析及预防故障,保障资源稳定运行。
平台分为四个模块,分别为数据接入、数据处理、数据应用、可视化。围绕运维整个过程,系统内置丰富的知识库,融入关联性分析、工具联动、预警趋势分析、原厂知识库联动,在预警中可快速自动关联,方便知识的快速应用,同时知识库在运维运维工作中可自动更新,不断成长。
数据接入:该模块是系统的基础,主要实现各类资源对象数据的接入,如网络设备、服务器、应用、数据库、中间件、存储、虚拟化、无线设备、链路、日志、配置、流量等数据的采集主要通过该模块实现。该模块提供标准的API接口,平台在接入第三方系统的相关数据的同时,也提供对外的标准接口,方便第三方系统调用平台的数据。
数据处理:该模块是系统处理器,主要通过三大技术引擎实现数据的处理。三大技术引擎包含数据缓存、实时处理、大数据处理。数据缓存引擎技术主要是在大规模并发数据下存储与查询的重要缓存手段,在内存中开辟内存空间作为数据缓存区域,旨在提高数据的存储与查询速度,实时处理主要用于数据的分流、策略控制、指标控制等传统的数据逻辑控制。大数据处理主要旨在学习应用程序和资源的行为,动态调整阈值,并预测与关联性分析预警行为,并可持续学习与优化。可通过大数据学习指标异常,自动判别指标是否异常。
数据应用:该模块输出给医院可用性功能,主要包含运维监测,业务监测,安防管理,服务台,服务流程和其它模块。运维监测主要能对全网资源实时监测并预警,同时生产各类丰富的报表。业务诊断主要对资源进行业务建模,对业务进行全面评估。安防管理主要实现对视频等资源的研判管理,对安防资源KPI指标的性能分析与全局统计。服务台与服务流程则是对运维过程的闭环管理,实现工单的流转与资源调度。其它模块主要包含环境、制度、维保、定制开发等模块。
可视化:该模块主要通过大屏可视化、拓扑可视化、业务可视化、3D可视化、预警看板等进行可视化输出,方便运维人员快速定位故障的同时也是对医院信息化建设与运维成果的输出呈现。
2 虚拟化服务,略
3 虚拟化软件系统
3.1智慧医院虚拟化软件建设思路
基于智慧医院、安全等保等国家法律法规,以及医疗行业规范、标准之要求,以给医院业务提供优质的信息技术支撑环境为目标,采用软件定义数据中心(SDDC)和云计算等前沿技术,优化和建设医院的云平台。
我院云平台建设将基于业务可用性、系统安全性、技术成熟性、视野前瞻性等设计原则,从一开始就进行统一规划,既着眼于当前需求,也考虑到业务发展对基础架构将来的要求,从私有云、公有云以及混合云等多个方面进行规划设计。一套完善的私有云平台,由云资源平台、云安全平台、云运维管理平台、云自助服务平台构成。本次项目我们将优化当前的云资源平台,打造云安全平台,构筑云运维管理平台,规划云自助服务平台,建设我院完整的私有云平台。
将来,我们可以把院内私有云延伸到公有云上,在公有云上部署跟私有云相同的云资源平台和云安全平台,在私有云和公有云之间建立安全的数据传输通道,并且将两片云在底层打通,形成一个集中统一的云平台,让医院业务系统能够自由上云下云。
3.2智慧医院虚拟化软件方案设计
本次项目采用超融合技术,使用2 台标准X86 服务器,以及1台万兆网络交换机,构建一套集中统一的私有云平台,物理结构如下图所示:
本次项目设计的私有云平台,包括云资源平台、云安全平台、云运维监控平台、云自助服务平台,逻辑结构如下图所示:
3.3智慧医院虚拟化软件方案描述
1)云资源平台
我院云资源平台将具备可用、可控两个特征。
可用性体现为各种资源和服务工作正常,且具备良好的性能,即可用、不卡。通过使用多链路、多副本等冗余技术实现容错,通过自愈功能自动修复故障,确保可用性;通过分布式、负载均衡等技术,分散负载,避免热点,确保性能。超融合技术是达到前述效果最理想的技术。建议采用软硬件分离的超融合技术,作为云资源平台的底层支撑技术,整合硬件服务器的计算、网络、存储资源,充分保证云资源平台的可用性、可靠性、性能及弹性,软硬件分离模式具备良好的开放性,有利于跟其他组件的集成,而不会被某个厂商所绑定。
可控性主要体现为云资源平台的规模和云操作系统版本可控。云资源平台具备很好的弹性,能够方便地在线进行横向和纵向扩容,而且能够保持计算、存储和网络三种资源同步扩容。多数情况下都存在新旧服务器并存的情况,这就要求部署多个版本的云操作系统,云资源平台管理系统必须能够支持多个版本的云操作系统,从而实现一套云资源平台管理系统管理所有云主机,简化管理。云操作系统必须支持滚动式升级,避免升级中断业务系统运行。
2)云安全平台
我院云安全平台设计目标主要有两点:对外合规性要求;对内消除风险和威胁的要求。
安全等保、智慧医院等合规性要求,主要强调的是部署一些安全设备,而云安全平台通过软件定义的方式,提供包括防火墙、路由器、VPN、流量监控、防MAC 及IP 欺骗、第三方防毒系统/IDS/IPS 整合等在内的诸多安全功能,能够从二至七层全面保护云主机及业务系统,基本已经能够满足合规性要求。
安全风险和威胁方面,主要是当前服务器均位于一个网段,导致实体安全设备无法伸入云资源平台及业务系统。云安全平台为每一个云主机构筑一道专门的防火墙,相当于每台云主机都是一个安全区域,一个独立的段,这种微分段技术能够精确控制每台云主机的安全保护要求,通过严格的安全策略,有效阻止病毒扩散和黑客入侵。云安全平台的流量检测和进程监控功能,能够帮我我们准确发现云资源平台上的异常流量,以及云主机系统进程的异常访问行为,帮助我们快速定位和清除病毒、木马、蠕虫等恶意程序,以及黑客留下的后门。云安全平台的VPN 功能具有多种用途,一是可以加密私有云和公有云之间、以及异构的私有云之间的数据传输,二是把私有云和公有云、或者异构的私有云的网络打通,形成一张安全的大网,从而支持我们的云主机和业务系统自由迁移到公有云或者异构云,以及从公有云或者异构云迁回到私有云或者其它公有云。云平台提供的第三方安全集成功能,能够把防病毒、IDS、IPS 等第三方厂商的产品集成进来,进一步丰富云安全平台的功能。
云安全平台具备功能分布、集中管理的特点,功能采用分布式确保了安全功能具备良好的性能、可用性和可扩展性,而集中管理降低了管理复杂度,提高了可管理性。信息安全建设需要以国际上通用的安全模型和安全框架为基础,设计一套完善的安全体系架构,制订相关的安全策略,配备相应的安全组织和人员,并辅以先进的技术作为支撑。而一套功能齐全、性能优异、弹性可扩的云安全平台,无疑就是最好的技术支撑。
3)云运维管理平台
云运维管理平台设计目标分成两个级别:基本和高级。基本目标是具备友好的管理界面,能够全面监控云平台各个组件的运行状态和健康状态、以直观的形式呈现出来,并且能够在特定事件发生后立即触发报警,通知管理员。高级目标体现为可视话、智能化和自动化。
可视化:云平台全网流量可视,按照各种标准统计流量,帮助管理员轻松把握云平台网络、应用及各种服务运行状况和使用情况,及时察觉异常流量和服务,防范于未然。考虑到云平台使用了各种高级技术,底层比较复杂,云监控管理平台能够提供云组件360 度可视,任何环节的问题都能直观呈现出来,并提供内置的数据传输通路测试工具,提供故障处理建议,以向导模式逐层深入,帮助管理员一步一步排查和快速解决问题,大幅提升故障处理效率,提高业务可用性。
智能化:以大数据思想为基础,收集、分析和统计云平台各个维度指标,提供数据增长、容量使用、健康状况等多个方面的趋势,为架构师评估和规划云平台扩容提供充分精确的依据,避免盲目投资。
自动化:随着业务持续发展,云平台规模也会持续增长,纯手工管理的效率会逐渐跟不上节奏。云管理平台能够提供CLI、API、以及管理自动化引擎,通过命令行、脚本、流程自动化、以及跟第三方网管平台整合等技术,实现大部分工作的自动化,例如自动化巡检、自动化开关云平台。一方面能够提高管理效率,另一方面能够避免管理员陷入简单重复的机械式管理任务,有时间学习研究新技术、思考如何优化基础架构和业务系统,体现出更大的价值。
4)云自助服务平台
云服务有三种模式:IaaS、PaaS、SaaS。IaaS 基础架构即服务,为用户提供和维护服务器及操作系统;PaaS 平台即服务,为用户提供和维护中间件、数据库以及开发环境;SaaS 软件即服务,为用户提供和维护业务软件。公有云厂商能做到三个层面的服务,而一般私有云产品只能做到IaaS。我们作为云计算领域领导者,能够实现XaaS,即一切皆服务。通过调用第三方系统的接口以及自动化流程编排,能够整合很多IT相关的系统,将其以自助服务的方式发布出来,供业务部门订阅和使用。例如,当有新员工入职,人事部门需要向IT 部门申请在各种系统里面建账号,例如AD、EMAIL、CRM 等,过程很繁琐。但是通过XaaS 技术,可以将这些操作提前做成自动化流程,并发布在云平台自助服务门户上,后续由人事部门直接使用服务就能完成各种注册事宜。大大简化流程,提高办公效率。