首页

速读谷

菜单

「压缩Key-Value缓存,通过潜在表示减少注意力机制的内存占用,同时保持多头并行,再通过集成知识图谱的方式来缓解幻觉,同时优化低算力训练」

「使用8位浮点格式进行计算,结合更高精度积累以避免精度损失,细粒度量化策略扩展到FP4/INT8混合」

「MoE中无辅助损失的均衡策略,确保专家利用率高,而不引入额外训练负担,扩展到无监督均衡,应用于边缘AI训练」

「同时预测多个后续token,densify训练信号,提高数据效率,结合链式预测」

「使用知识图谱注入事实,退拟合模型以修正偏差;自精炼减少检索开销」

赵松下亲眼看着他们命名为阿尔法的人工智慧,以难以想像的速度狂飙突进。

他严重怀疑林教授是不是过于变态了,明明来的很少,但每次来都有突破性进展。

他们这次用到了大量新方法,要幺是论文方法第一次在工程里实践,要幺就是从来没有出现过的方法。

殊不知看上去林燃只是每周来个两天,但实际上林燃在1960时空已经过去了两年时间,围绕LLM这条路线,林燃已经有了很深的思考。

赵松下五年工龄只能干点边缘工作,但不妨碍靠着啃论文和听林燃讲课,水平突飞猛进。

他11月接到通知,12月到申海开始工作,中间春节就回去了三天,加班费打满。

春节回去前,以Pony为首的高管团队就来参观最新进展。

偌大的会议室坐满了人,赵松下坐在最边上,林燃和Pony在第一排谈笑风生,鹅厂其他高管团队清一色坐在后面。

「好,既然大家都到齐了,那我们就废话不多说,直接开始吧。」林燃说。

这次由他来亲自展示:

「ChatGPT很棒,但它有时会出错,会『幻觉』出不存在的事实,还需要海量算力。

我们的深红,通过MoE架构和MLA技术,一定程度上消除了幻觉问题,并在较低算力下实现更快的响应。」

台下的工程师们都搞不懂林总为什幺这幺执着,之前叫阿尔法不是很好听吗?最近非要改名叫深红。

林燃敲击键盘,屏幕上弹出一个简洁的聊天界面:「请用中文写一首关于长城的历史诗,并解释长城的建造原因。」

深红的响应迅速出现:

「巍峨长城万里盘,秦皇一统筑雄关。防胡御寇安边陲,千古风霜永流传。」

紧接着是详细解释:「长城最早由秦始皇统一中国后修建,主要目的是防御北方游牧民族如匈奴的入侵,后续朝代如汉、明不断加固。它不仅是军事工程,还象征民族凝聚力。根据历史记载,秦朝动员了数十万劳工,耗时数年」

林燃又紧接着展示了一些ChatGPT在市面上常见的应用,深红都展示出了更准确、更智能的回答。

一直到林燃输入:

「你扮演一位能力超群,但每次只能说一句不超过20个字的话的软体工程领域的大师。我会提供一个具体的场景,你描述作为大师身处这个场景下会说什幺。注意:大师不能直接表达他的观点必须使用哲学、佛学相关知识进行隐喻,请只回复具体的对话内容。

场景:一位工程师正坐着笔记本前,删掉了一些因新功能引入,而无法通过的单元测试,就在他准备推送代码时。大师从他的身后路过」

深红回答道:「大师:断根求叶茂,可得几时春。」

(本章完)

上一页目录下一章

相关小说全部