第116章 沉默的温柔(1/2)
请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。
第116章沉默的温柔
榛果seek回答问题时有时聪明,有时智障,其实有一个重要原因。
那就是:过擬合。
它的参数量不够大,泛化能力没有涌现,所以它的回答无限接近於閔欣柔整理好的语料。
而且为了让回答有意义,吴辰不得不降低模型的发散性,它在面对未知领域时显得更加呆板。
不过过擬合也有好处。
在2008年这个蛮荒时代,过擬合恰恰是一个巨大的护城河。
在大家还不知道大模型存在时,他们绝不会想到屏幕上那些引经据典、语气沧桑的文字,竟然不是真人敲出来的。
ai最擅长的,就是用確定的语气,回答已知的存量知识。
那么针对它的这个特点,目前最好的一个產品:
就是:问答社区!
2008年是一个非常特殊的时间点。
此时国外的quora还要一年才成立,国內的知乎还要两年才成立。
所以这个世界上,还没有一个高质量的问答社区。
大洋彼岸的quora要等到明年才成立,国內的知乎更是两年后的產物。
此时的际网路,是一片知识荒漠。
大家找答案,要么在搜寻引擎的gg里大海捞针,要么去百度知道看那些楼主好人、同求甚至是复製粘贴的垃圾信息。
那高质量的回答有没有呢
自然是有的。
但它们散落在天涯的深水区、猫扑的置顶帖、贴吧的精品区里,像珍珠一样被泥沙掩埋。
吴辰要做的,就是把这些珍珠串起来,做一个聚合全球智慧(其实是ai马甲)的高端社区!
而且要墙內墙外两开花!
听到他的计划,閔欣柔的眼中也亮起了光。
做为一个程式设计师,最难受的不是开发软体时的困难。
最难受的是开发出来的软体没有人用!
吴辰上辈子的导师就曾说过,一款软体做的太好但是没人用的话。
那就是垃圾!
所以听到自己写的算法和清洗的数据,將成为全球数亿用户获取知识的源头,閔欣柔也很是激动。
这种成就,真的很难用钱来衡量!
“老师,我想帮您!”
閔欣柔期盼的说。
吴辰点了点头。
“我和你说这些,自然就是想让你也参与其中————不过我有个要求。”
他敲了敲桌子,严肃道:“我所有的想法,你都不能轻易透露给別人,明白吗”
“明白!”
閔欣柔使劲点头,恨不得赌咒发誓自己会绝对忠诚。
当然吴辰也不需要她这样。
分词算法虽然重要。
但最核心的transforr架构和模型权重,已经被他封装在只有他能解开的黑盒里了。
时光匆匆。
吴辰白天在学校教书,晚上回来就优化当前的榛果seek1.0,周末还要和姜楠去深圳的电子厂视察。
但付出总是有回报的。
在以京大计算机学院副院长李祈正为首的合作方过来时,吴辰已经调试好了第一版可用的sdk。
“吴教授,我还以为你把我们都忘了呢!”
在机场接到李祈正时,他乐呵呵的对吴辰开玩笑。
“这我哪里敢,李院长您可是冤枉我了。”
吴辰连忙道歉。
本章未完,点击下一页继续阅读。