课题、项目、论文等科研任务经常有突发性算力需求,本地资源通常无力支撑
Linux系统环境上手困难
超算资源需提交申请和排队,常面临资源被抢走的窘境
科研经费与本地计算资源有限,对特定资源的需求难以满足
团队成员缺乏使用经验,经常超量使用资源
没有专人进行工具和资源管理
缺乏专业IT,导致团队成员耗费过多精力在运维上
在赶科研进度时需要时刻盯着机器,影响科研任务周期
IC617、Spectre、VCS、Verdi
IC实训
1涉及IC研发全流程,需对多个EDA工具做管理和维护
2项目需要灵活地调配不同规格、数量的资源
3实训中需以集群化方式进行仿真计算
4整体平台的架构与设计要基于私有云
Fluent
工程仿真
1本地服务器长期被其他课题组占用,超算排队时间长,机器利用率不高且缺乏技术支持,使用体验不佳
2单机运算,任务运行效率低,迫切想要提升科研效率
3使用者基础不同,不想改变原先的本地使用习惯
4希望能简化任务流程,把精力专注在科研项目上
MOE、Amber
分子模拟、自由能计算
1用户需在2天内对200000个分子进行模拟,当前机房资源缺口极大,至少需要一周以上才能完成任务
2用户目前有16008个任务需使用Amber进行自由能计算,估算使用本地CPU资源可能要1年,使用单块GPU需要至少4个月,周期过长,课题等不了
3因课题组有多名学生,需要一个既能快速启用,同时又操作简单便于管理的解决方案
PyTorch
AI计算
1单机训练,本地多台机器无法进行统一管理,资源利用率低
2GPU资源分散,只能单机使用,难以进行分布式训练
3缺乏资源使用管理流程,日常使用基本靠抢
4模型、数据集和镜像散落在单机上,没有统一的平台管理,维护工作繁琐
5训练任务环境配置复杂、费时费力,移植难度高
6难以对训练效果进行评估分析和调优
AlphaFold2、RosettaFold
蛋白质预测
1用户本地集群环境资源有限且缺乏GPU,算力不足导致任务排队,严重影响课题研究进度
2GPU资源采购周期长且单价高,一次性采购投入太高
3用户对软件的安装、配置、调优等工作较陌生,希望能有专业技术支持
IC617、Spectre、VCS、Verdi
IC实训
1涉及IC研发全流程,需对多个EDA工具做管理和维护
2项目需要灵活地调配不同规格、数量的资源
3实训中需以集群化方式进行仿真计算
4整体平台的架构与设计要基于私有云
Fluent
工程仿真
1本地服务器长期被其他课题组占用,超算排队时间长,机器利用率不高且缺乏技术支持,使用体验不佳
2单机运算,任务运行效率低,迫切想要提升科研效率
3使用者基础不同,不想改变原先的本地使用习惯
4希望能简化任务流程,把精力专注在科研项目上
资料获取/技术咨询/免费试用
小F@速石科技
上海速石信息科技有限公司 ©2025 fastone 沪ICP备18017266号-1