嘿咯AI新闻

这篇文章主要介绍了EAGLE-3项目,这是一个旨在提高大语言模型推理速度的开源工具。通过在训练过程中使用投机采样的方法,EAGLE-3能够显著提高大语言模型的推理速度,具体来说,其加速比可以达到6.5倍,而无需改变大语言模型的输出分布。此外,随着训练数据的增加,加速比还可以进一步提高。 文章还详细介绍了EAGLE-3的工作原理和实验结果。EAGLE-3通过在特征层进行自回归,并利用目标模型的分类头得到草稿token,这种方式相比在token层面进行自回归有更好的性能。同时,EAGLE-3引入了新的损失函数,以兼顾模型的 scaling up 能力和生成多个草稿 token 的能力。 此外,EAGLE-3的作者们还对其他投机采样方法进行了实验比较,发现EAGLE-3在多轮对话、代码、数学推理、指令遵循、总结五项任务上分别使用MT-bench、Humaneval、GSM8K、Alpaca、CNN/DM数据集进行了实验,并与7种先进的投机采样方法进行了比较。结果显示,EAGLE-3在所有任务和模型上,加速比和平均接受长度都是最高的,明显优于其他方法。 最后,EAGLE-3已经被集成到SGLang中,并在生产级框架下取得了数倍加速效果。

2025-04-10 12:56

丛京生院士因开发FPGA工具获得ACM计算突破奖 国际计算机学会(ACM)宣布,丛京生因其在可定制系统和架构设计工具方面的开创性贡献而获得2024年ACM计算突破奖。该奖项旨在表彰那些对计算理念或技术做出的惊人、颠覆性或跨越式贡献的个人或团体。 丛京生,1963年出生于北京,1985年毕业于北京大学计算机科学与技术系,后赴美国留学;1987年和1990年分别获得伊利诺伊大学香宾校区计算机科学系硕士和博士学位。他现任加州大学洛杉矶分校Samueli工程学院Volgenau卓越工程主席,研究领域包括VLSI电路和系统的设计自动化、可定制计算、量子计算和高度可扩展算法。 丛京生在学术界和工业界开发了一系列用于自动化集成电路设计的卓越工具,尤其是用于现场可编程门阵列(FPGA)的工具。他的工作使人们现在可以使用C或C++等软件编程语言对FPGA进行编程,显著提高了FPGA的可访问性和可用性。此外,他在1990年代末研究了如何将逻辑映射到查找表(FPGA的基石),取得了重大理论突破。 丛京生及其团队开发的AutoESL和AutoPilot等产品为FPGA综合工具的发展奠定了基础。他们利用这些工具应用于可定制的特定于具体领域的计算领域,如深度学习、医学图像处理、基因组测序等,这些解决方案具有显著的能效优势。 丛京生的研究成果不仅推动了FPGA技术的发展,也为人工智能、云计算和其他快速发展领域的前沿应用提供了重要支持。

2025-04-10 12:56

Gradio 5.24版本发布,引入全新ImageEditor组件,提供专业级图像编辑功能。该组件支持缩放、平移和透明度控制,以及自定义图层,显著提升图像处理灵活性和效率。此举被视为开发者福音,有望推动AI演示工具领域进步。

2025-04-10 12:56

中国移动董事长杨杰在2025年云智算大会上宣布,到2030年AI任务流量将占全网60%。预计推理算力增速将是训练算力的四倍,推动行业向智能化转型。中国移动已优化算力布局、加强算法一体化融合,并提升全域AI化水平,构建了以AI大模型为引擎的算法融合调度体系,实现了AI技术的全面升级。

2025-04-10 12:56

量子人工智能初创公司SandboxAQ宣布完成E轮融资,筹集资金达4.5亿美元。此次融资吸引了谷歌、英伟达等巨头投资,总融资额达到9.5亿美元。公司利用量子计算技术开发模型,应用于药物发现、金融建模等领域。与谷歌云和英伟达合作推广产品,加速研发进程。

2025-04-10 12:56

复旦大学与AI创新企业阶跃星辰合作推出OmniSVG,一款多模态矢量图生成模型。该技术通过三种模式支持从文字描述到角色参考的SVG图像生成,具备解耦结构与几何的能力,并有望推动数字创作领域向智能化新阶段迈进。

2025-04-10 12:56

工业机器人市场预计到2035年将达到2910亿美元,主要受到自动化和AI进步的推动。东亚地区在工业机器人市场中占据了三分之二的市场份额,汽车和电子行业将主导市场。AI驱动的机器人将改善工作流程,使自动化成为企业发展的必然选择。

2025-04-10 12:56

九章云极DataCanvas公司自主研发的“弹性容器集群VKS”技术,因其灵活的拓展能力、高安全性和低成本等核心优势,成功入选2025全国企业“人工智能+”行动创新案例TOP100。该技术通过一键式独立Kubernetes环境部署,实现算力资源的秒级弹性伸缩与智能隔离,显著降低企业用户的运维成本,并提高资源利用率。此外,VKS支持多环境一键创建与释放,适配AI开发、测试、生产全流程;通过轻量级虚拟化技术保障不同业务间的算力安全,有效防止资源滥用和安全漏洞;支持按需使用、动态释放的计费模式,显著降低算力综合成本。这一入选体现了九章云极DataCanvas公司在推动“人工智能+”战略落地方面的重要地位和影响力。

2025-04-10 10:56

AI代码模型开源潮来袭:Cogito v1 Preview震撼亮相,70B性能碾压Llama 4 近日,AI代码生成领域掀起了一波开源热潮,多款重量级模型接连亮相。Deep Cogito推出的Cogito v1Preview系列尤为引人注目,涵盖3B、8B、14B、32B和70B等多种规格,在性能上全面超越同级竞争者,其中70B版本更是力压Meta最新发布的Llama4109B MoE模型,成为业界热议的焦点。这一系列模型的发布,为开发者提供了强大的编程利器,预示着AI技术在编码领域的全新突破。

2025-04-10 10:55

斯坦福大学人工智能研究所发布了2025年人工智能指数报告,指出中美顶级AI大模型性能差距已缩小至0.3%,中国和美国在AI领域的影响力日益接近。阿里巴巴以6个模型入选全球重要大模型(Notable Models),位列第三,且其开源AI模型数量超过10万,超越美国Llama成为全球最大的开源大模型生态。

2025-04-10 10:55