第1085章 年度最佳穿戴设备(2/2)
陈默在旁边飞速记录。不是记参数——参数他不懂——他记的是李建国判断的逻辑链条。从刀具材质到工件材料到热传导特性到表面质量要求,五步推理,每一步都基于经验而非公式。
这就是数据库里缺的东西。
不是“正确参数是多少”——那个查手册就有。缺的是“为什么这个参数是错的”——错误的机理、失败的后果、相互关联的约束。这些东西存在于老技工的脑子里,从来没被系统性地记录过。
因为没人觉得“什么是错的”值得记。
十二个老技工在第二天全部到齐。陈默把他们分成三组,四人一组,八小时一班。每一班审核三百到四百组AI方案,对其中的错误进行标注和纠因。
方式极其原始:老技工口述,旁边坐一个陈默的工程师打字记录,录入标注系统。
第一天。审核量四百一十二组。标注出的错误方案七十九组。错误类型五花八门——有参数偏离常识的,有工序顺序颠倒的,有刀具选型跟工件硬度不匹配的。最离谱的一个案例是AI给一块铝合金零件设计了一套线切割方案,但那个零件的壁厚只有0.3毫米,线切割的电极丝直径就有0.25。按李建国的话说:“这跟拿菜刀削牙签有什么区别。”
第二天。审核量上升到六百组。老技工们渐渐熟悉了屏幕操作,速度快了。蓉城来的老吴——做了二十六年航空件——发现了一个系统性的问题:AI在生成变截面叶片的精加工路径时,总是选择从叶尖往叶根方向走刀。但实际操作中,这种走刀方向会导致叶片尾缘的薄壁区域在切削力作用下产生振颤。正确的做法是从叶根往叶尖走,让厚壁区先承受切削力。
“这东西把方向搞反了。”老吴说得很平淡,像在说今天食堂的菜咸了。
陈默把这个发现当成一条规则,写进了物理约束层。
第三天。温州来的赵老板——就是之前在饭局上第一个拍桌子的那位——送了一段语音消息:“我的三个师傅都说太累了。他们不是审方案累,是跟你们的工程师解释为什么错的时候累。我们车间里手一指就明白的事,对着电脑得讲半天。”
陈默想了个办法。他把标注系统改了——增加了一个“语音直录”功能。老技工不需要再逐字逐句地跟工程师解释,直接对着麦克风讲,系统自动转文字并提取关键参数。
效率翻了一倍。
第四天。一万四千三百条标注数据。
李建国的老花镜在第三天晚上断了第二条腿。他找超算中心的后勤要了一卷白色医用胶布,把镜框缠成了一个不规则的多面体。戴上之后,两只耳朵上方各鼓出一坨白色的胶布团。
赵勇拍了一张照片发到工作群里。配文:“敦煌超算中心年度最佳穿戴设备。”
群里笑了几秒就没了动静——大家都在忙。
第五天。陈默开始把标注数据灌进模型做第二轮训练。
当夜凌晨两点。训练面板上的损失函数曲线出现了一次他入行以来没见过的形态变化——不是渐进式的下降,是断崖。曲线在某个迭代步骤之后直接掉了一个台阶,像被人拿刀切掉了一截。
他呆呆地盯着屏幕看了两分钟,然后跑到隔壁把小赵叫醒。
“你看这个。”
小赵揉着眼爬起来,看了十秒。
“什么情况?”
“涌现。”陈默的嘴唇干得发白,“那一万四千条标注数据不是普通数据——它们是元数据。告诉模型什么是错的、为什么是错的这一层信息,对大模型来说是一种更高维度的知识。它改变的不是模型对单个参数的估计,而是模型对可行性这个概念本身的理解。”
小赵没听懂后半句,但损失函数的曲线他看得懂。
那条线在后续的迭代中继续下降,平稳、均匀,没有反弹。
第六天早上,陈默跑了航空叶片设计的盲测。
同一组气动载荷参数。同一个测试流程。
模型用了四秒完成输出。三维模型的外形跟上次一样漂亮。但加工方案完全不同了——进给速度1750,刀具选型R4球头铣刀,主轴转速5500。每一个参数都落在老技工们标注的合理区间内。
陈默把生成的方案发给李建国审核。
十分钟后李建国回了一句话——他花了两天学会了用微信语音:“这个方案能用。让机床跑跑看。”
盲测结果:模型在航空叶片设计任务上的准确率从85.7%跳到了97.2%。14.3%的幻觉率降到了2.8%——剩下的2.8%主要集中在极端工况的特殊加工场景,那些场景连人类专家的意见也不统一。
陈默把结果发给苏哲的时候没打字,发了一张截图——模型评测面板的雷达图,六个维度全部超过了人类专家的平均水平。
苏哲看了截图,回了三个字:“精密模具呢?”
陈默笑了。苏哲永远只问还没解决的事。
好消息是温州来的三个老技工在精密模具领域的标注工作已经完成了百分之八十。按目前的进度,两天后可以灌入训练。
同一天下午。威尔逊从旧金山发来了一条加密消息。
“Fe的内测版泄露了。暗网上有人在卖,标价五千美元。我让人买了一份,交给三个独立的制造业技术顾问做评测。结论附后。”
三份评测报告,每一份不超过两页。措辞各异,但最后的判断高度一致。
评测一(汽车领域):“在标准乘用车底盘零部件设计中,Fe的输出质量可接受,部分方案有工程参考价值。评分:B+。”
评测二(航空领域):“在航空结构件设计中,Fe生成的方案存在大量不可接受的参数组合。多个测试案例中,推荐的切削参数会导致工件热变形超过公差范围。评分:D。备注:如果有人按这个方案加工真正的飞机零件,我建议他们先买好保险。”
评测三(精密模具领域):“离谱到危险。Fe对模具型腔的曲面加工路径规划完全不考虑弹刀效应和残余应力。按照它的方案做出来的模具,第一次合模就会开裂。评分:F。”
陈默看完评测报告,把报告转发到了工作群里。群里安静了一分钟。
然后李建国发了一条语音:“我不懂英语,但F是不及格的意思吧?”
“是。”
“那他们那个AI还不如我带的学徒。学徒至少知道弹刀是个什么东西。”
第七天深夜。精密模具领域的标注数据灌入完毕。模型完成了第三轮全量训练。
陈默在凌晨四点的时候做了一件他之前从来不做的事——他没有跑标准盲测,而是给了模型一个完全开放的设计任务。
“设计一种适用于高功率密度芯片的新型散热结构。约束条件:安装空间50×50×15毫米,散热功率不低于300W,材质限定为铝合金。”
这个任务没有标准答案。训练数据库里也没有完全匹配的案例——300W功率密度在50毫米空间里的散热,现有方案要么用铜基材料,要么借助液冷循环。纯铝合金被动散热做到300W,没人做过。