Zhihe Computing Huang Yihao:基于Risc
发布时间:2025-07-21 12:55
知合计算7月18日,第5届RISC-V峰会中国参加了上海的一项副校园会议。作为未来电子行业最大的应用领域之一,人工智能是不可避免的主题。人工智能的快速发展促进了基本建筑的创新,这是计算机能源需求的平均年增长率超过100%。 RISC-V“开放,灵活和可定制”是建立独立计算机功率基石的战略支持点。人工智能子宫邀请所有有关方面讨论RISC-V体系结构如何利用开源功能,开放且可扩展的功能,以允许AI计算机架构中的创新以及如何在AI软件和硬件中实现RISC-V Architectures应用程序的最新进展和实现。 De Zhihe Computing Solutions总监Huang Yihao分享了创新的进步和大规模MO的应用基于RISC-V架构的DEL Technologies。自《变形金刚》于2017年6月和2025年7月出生以来,已经过去了八年。在这个周期中有几个标志性的事件。 Chatgpt于2022年11月的实施导致了对一个伟大模型的高期望。然后,在今年1月,DeepSeek的出现在当前的开放和开源模型中达到了新的认可水平。我们看到该模型在整个过程中都经历了许多变化,但是如何调整其创新点,其基础体系结构仍然是变压器。该模型通常是“充满花朵”的,但是主要操作员逐渐收敛。引入了三个模型:第一个GPT-2,其次是Qianwen和DeepSeek R1型号。它的模型架构非常统一,而原始部分则是符合的。在第二阶段,提出了FFN,而新的FFN是MoE架构,旨在减少计算工作。变化SE模型是专注于特定体系结构而不改变一般变压器的结构。它的运营商基本上关注“ 22,21”。实际上,它们都与这些操作员“ 22,21”非常相似。如今,不仅要集中模型的计算机功率,而且模型子之间的计算机功率也非常集中。在所有运营商中,我们组织了最有用的操作员之一。 DeepSeep7b模型具有11个中央运算符,矩阵计算量约为95%。作为一组开源说明,RISC-V非常可扩展并集成了AME说明。目前完全适用于Matmul操作员。 AME可用于优化,但三个操作员除外。除了在体系结构层面上进行微型创新外,该模型的创新还有另一点:它正在调整操作员的数据格式,包括当前DeepSeek FP8中最早的FP32。现在,AME操作员指示可以实现16 - 线矩阵大小,每行约为512位,矩阵大小同时等同于字节。 Huang Yihao共享的中心点是,在变压器之后,AI从原始的简单识别函数移动到当前的认知函数。在下面的图的左侧,有一个带有卷积的传统CNN网络。可以实现的最直接效果是认可。您可以了解“销售者,汽车,动物”,但是很难确定它们之间的关系。连接到较大模型后,您可以通过统一的变压器和购买来确定不同对象之间的运动和关系。它显示了“竹餐厅”和第二张照片显示“植物昆虫”的效果。这只能认识到植物中留在植物中的昆虫。除了这两种情况外,我们还与客户合作,共同制作家庭场景。换句话说,“孩子们寻找孩子EN可以在手机上学习和玩耍。在AI中,我们将提供“综合促销” A210的CPU产品,该产品接纳了操作员,对第二芯片A600的内部搜索。Mplete AI代理。从我们的角度来看,目前很难成为完全标准化的AF代理。作为Endrey芯片,例如A210,最终测试芯片更适合标准化和分段场景中的AI代理。中心的歧义过程被模型所取代,尤其是第二段。 “您必须消除原始的巨型Mac汉堡包,然后将其更改为源并添加尾巴。”这种情况已被处理,但我将所有这些都传递给了模型并起诉以获得这样的结果。在A210应用“漫射搜索”的情况下,“识别三幅图像的识别”,这三张绘画图片指向三个最重要的位置,“蜘蛛侠二级培训”的“蜘蛛侠二级训练”的特定数据材料对每种情况的特定阶段和一个典型的播放概述了。最大模型运营商的整合提供了一些生态分裂RISC-V的捐赠。通过传统逻辑,RISC-V与手臂有很大的生态差距。这是因为在RISC-V矩阵和向量计算中,操作员的集成是相同的起始线。任何人都可以通过开放的RISC-V源和大型模型逐步进行开源,从而更快,直接地优化这些操作员。