第630章 卡脖子(1/2)
请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。
穿过北疆科大的校门,越过两栋教学楼,实验室里,李泽和姜伊伊安安静静地坐在门口的位置。
虽然是周末,但吴晓忠的实验室却没有休息。
“老师,这次我只微调了150个参数,可这任务卡在99%已经两天了,咱们实验室的算力什么时候能增加一些?”
吴晓忠的学生王楠在一旁抱怨道。
他也不想周末泡在实验室,可手里的任务一直在延迟,倒不是他代码写的慢,而是实验室的算力实在是不够用。
吴晓忠主攻的就是AI大模型,之前接受李泽的投资,大模型研发有了长足的进展。
甚至已经有了很多成果落地。
可在继续迭代的过程又遇到了问题,数据工程、架构创新等基础都已经做到极致。
可问题就出现在调参训练上,实验室的硬件有限,每次跑任务都要等上几天。
写代码只要一小时,可等任务却超过了3天。
吴晓忠的大模型在这样的效率下,不仅没有掉出第一梯队,还能跟上世界先进水平,已经很不容易了。
要知道,现在的大模型动不动就上亿级别的参数,每次只优化几百个,这效率可想而知。
“困难总是有的,想办法克服就是了,等熬过这一段时间,一切都会好的。”
吴晓忠出言安慰道。
他也不是没做出改变,模型架构已经优化到极致,kv缓存压缩至十分之一,长上下文显存占用降低90%。
分布式、无辅助损失负载均衡、双向流水线,能想到的都想到了,可问题是底层的硬件底座不够给力。
用的显卡是几年前的旧款,数量和质量都不尽如意,也不是他不想更新。
实在是丑国封杀得严,高端显卡禁运,吴晓忠想买也买不到。
想订购国内最新款自研显卡,可是产能又不够,那些大公司都吃不饱,他一个小实验室想抢到训练用的显卡太难了。
无奈,只能用时间来换,争取每次调参的代码准确性高一些,避免出现返工的问题。
又查看了几个学生的任务,吴晓忠慢慢走到李泽的身前。
这是他第二次见李泽,上次还是在海浪汽车的厂里,测试自动驾驶模型的时候。
他对李泽的印象很深,是个聪明孩子,而且还是李尚海的儿子,大家都亲切地称呼李泽为小李总。
“小李总,今天怎么有空来这里玩,是不是想提前感受一下大学的氛围?”
“吴教授,我这次来是有点事想请教你的。”
“哦?”
吴晓忠饶有兴趣地盯着李泽,一个小学生有问题请教他一个大学教授,多少令人有点好奇。
“说说看,有什么是要请教的?”
吴晓忠随便拉了把椅子,坐在李泽的对面。
本章未完,点击下一页继续阅读。