浪潮信息创新运维管理解决方案助力智算平台实现精确纳管

来源:半岛官方下载入口    发布时间:2024-01-11 01:19:43 点击:1次

  化建设突飞猛进,随之而来的运维和管理挑战也逐渐凸显,并愈发受到业界关注。为助力中南大学智算平台解决传统人力运维管理难题,浪潮信息以自研ISPIM平台为核心,为其量身定制了自动化运维解决方案,从而使运维效率大幅度提升。

  中南大学智算平台作为一个硬件先进、功能齐全、资源丰富,面向全校师生提供高性能计算服务的开放性公共服务基础设施,拥有高达上千台很多类型的计算服务器,在满足科研人员大量计算资源需求的同时,大量集中部署的计算服务器集群对管理和运维人员提出了新的挑战。基于传统运维模式既没办法实现对计算集群快速而精准的有效运维,也造成了运维人力资源的沉重负担。对此,浪潮信息提出了以自研ISPIM(Inspur Physical Infrastructure Manager)浪潮信息物理基础设施管理平台为核心的自动化运维解决方案。

  在方案设计过程中,浪潮信息研发工程师通过当地考验查证、调研并与中南大学HPC平台管理和技术人员进行多次反复的交流、沟通和分析、研究,最终决定以“1+1+N高可用模式”,在5台服务器上部署ISPIM系统,主动采集频率为45min,监控指标可达150W+,覆盖智算平台内的所有设备。得益于浪潮信息ISPIM平台丰富、强大的功能,在部署浪潮信息的自动化运维解决方案后,中南大学智算平台不仅非常大程度上减轻了运维负担,算力的管控也更加集中化、智能化;同时,运维人员还可以通过浪潮信息ISPIM平台随时随地监控整个平台的运作时的状态,实现能耗可查、可管、可控。另外,由于ISPIM平台故障报警能够以秒级的速度精准定位,中南大学智算平台的高效有序运转从而得到了进一步的保障。

  在各行业领域数字化智慧化转型不断加快的情况下,大规模的公司或组织未来对大规模计算服务集群的需求还将持续增长,面对与之相伴的运维压力,浪潮信息将充分的发挥自身技术产品等优势,一如既往地为用户更好的提供全面综合IT运维管理解决方案。

  》)则为推动我们国家数据中心基础设施集约化发展、促进绿色节能、推进技术迭代

  部署和计算能效显著提升 /

  力服务协助用户进行音乐分离AI模型的研究开发,很好地满足了模型训练过程中的计算资源需求。

  澎湃技术相互兼容性测试认证 ,测试结果为,博雅云OneSRM SMP存储

  完成兼容性认证 /

  软件栈 OGAI。OGAI (Open GenAI Infra)元脑生智,是为大模型业务提供AI

  InManage作为唯一的一款服务器厂商软件产品,凭借领先的AI能力,以及多个行业数据中心智能化

  ,与供应链及软件服务等生态合作伙伴共同构建的产品兼容性认证体系,包含“

  系统V8完成兼容性认证 /

  北京2023年12月6日 /美通社/ -- 11月29日,在北京举行的2023AI计算大会(AICC)上,

  加速生成式AI产业发展 /

  随着5G、云原生、大数据、人工智能等新旧技术不断融合,IT基础架构愈加复杂,可视化

  更高效 /

  嵌入式linux之go语言开发(十一)让web服务器跑在终端上,通过网页配置终端参数

上一篇:筑牢医院信息安全基石|海泰医院信息系统密码应用解决方案
下一篇:微创智能运维办理处理方案赋能某特大型石油石化集团信息建造工程