之前依靠刘教授协调和竞赛期间特批的超算中心机时,已经远远无法满足需求。
“这样不行。”
陈知行看着屏幕上因为算力不足而运行缓慢、甚至频频报错的模拟程序,眉头紧锁,
“按照现在的进度,完成底层理论的基础验证就需要至少半年,这还不包括可能出现的反复和调整。”
周炽也抓狂地揉着头发:
“我的多维参数空间搜索算法,每次迭代都需要巨大的计算量,现在这速度,跟老牛拉破车一样!”
陈知行尝试动用他的关系网去协调更多的机时,但国家级超算中心资源紧张,各个重大项目都在排队,短时间内难以大幅增加他们的份额。
苏想负责数据预处理和部分模块的初步测试,对算力瓶颈的感受同样深刻。
她看着团队陷入困境,心中焦急。
她想起之前顾延舟提到的“海外非敏感行业数据”和“额外资助”,但潜意识里,她对接受这种背景复杂的资助心存警惕。
“或许……我们可以优化算法本身?”
苏想提出想法,“减少不必要的计算冗余,或者寻找一些计算量更小的近似算法作为过渡?”
陈知行摇了摇头:
“核心理论的验证必须保证精确性,近似算法会引入不确定性。优化空间有限。”
就在一筹莫展之际,周炽猛地一拍桌子,眼睛发光:
“等等!我们能不能……自己搭一个小的分布式计算集群?”
“分布式计算集群?”
其他三人都看向他。
“对!”
周炽兴奋地解释,
“就是把多台性能不错的个人电脑或者工作站,用网络连接起来,让它们协同工作,共同完成一个大任务!
虽然单机性能比不上超算,但如果我们能搞到十几二十台,积少成多,也能解决不少问题!
而且自主可控!”
这个想法极具诱惑力,但也面临着现实问题:钱和设备。