嘿咯AI新闻

这篇文章详细介绍了智谱公司最新推出的AI产品——AutoGLM沉思,这是一个基于其全栈自研的Agent技术打造的智能体产品。文章从多个角度展示了这款产品的技术亮点和实际应用,包括其强大的推理能力、多模态理解能力以及在实际应用中的表现。 首先,AutoGLM沉思的最大特点是其“动手能力”,即能够边想边做,模拟人类在面对复杂问题时的深度思考和决策过程。这种能力使得模型能够像人一样进行复杂的操作和任务处理,如分析问题、生成报告等。 其次,该产品还具备强大的感知世界的能力,能够像人一样获取并理解环境信息。这使得它能够在各种场景下进行有效的工作,如小红书、公众号等平台的深度查询和总结。 此外,AutoGLM沉思还具有强大的工具使用能力,能够像人一样调用和操作工具,完成复杂任务。这一点对于许多需要大量数据处理和分析的场景来说,是非常有价值的。 最后,智谱公司在发布这款产品时,也宣布了其未来的发展计划,即专注于AGI和基座模型的研发,以及构建智能体平台,帮助应用合作伙伴做出成功的大模型应用。这显示了智谱公司对未来AI发展趋势的深刻理解和积极布局。 总的来说,AutoGLM沉思是一款非常强大且实用的AI产品,它的出现无疑将推动AI技术的进一步发展和应用。

2025-03-31 14:12

华盛顿大学的Cameron Glasscock和David Baker开发了一种基于深度学习的蛋白质序列设计方法,称为LigandMPNN,该方法能够模拟生物分子系统的所有非蛋白质成分。这种方法在与小分子、核苷酸和金属相互作用的残基方面明显优于Rosetta和ProteinMPNN,尤其是在天然主链序列恢复方面。LigandMPNN不仅能生成序列,还能生成侧链构象,以便详细评估结合相互作用。该研究以「Atomic context-conditioned protein sequence design using LigandMPNN」为题,于2025年3月28日发布在《Nature Methods》上。从头蛋白质设计能够创造具有新功能的新型蛋白质,例如催化、DNA、小分子和金属结合以及蛋白质-蛋白质相互作用。从头设计通常分三个步骤进行:首先,生成预测接近最佳的执行新期望功能的蛋白质主链;其次,设计每个主链的氨基酸序列,以驱动折叠到目标结构并产生功能所需的特定相互作用(例如,酶活性位点);第三,使用结构预测方法进行序列结构兼容性过滤。在蛋白质序列设计中,研究人员已经开发了基于物理的方法(例如 Rosetta)和基于深度学习的模型(例如 ProteinMPNN、IF-ESM等)。基于深度学习的方法在设计蛋白质骨架序列方面优于基于物理的方法,但目前可用的模型无法结合非蛋白质原子和分子。为了实现更广泛的蛋白质功能的设计,David Baker团队着手开发一种用于蛋白质序列设计的深度学习方法,该方法可以明确模拟完整的非蛋白质原子背景。他们试图通过推广ProteinMPNN架构来纳入非蛋白质原子来实现这一点。与 ProteinMPNN一样,研究人员将蛋白质残基视为节点,并根据Cα–Cα距离引入最近邻边,以定义稀疏蛋白质图;蛋白质主链几何形状通过N、Cα、C、O和Cβ原子之间的成对距离编码到图边中。然后使用具有128个隐藏维度的三个编码器层处理这些输入特征,以获得中间节点和边缘表示。他们尝试引入两个额外的蛋白质-配体编码器层来编码蛋白质-配体相互作用。Baker团队推断,当主链和配体原子在空间中固定时,只有在紧邻的(~10 Å以内)配体原子会影响氨基酸侧链的身份和构象,因为配体和侧链之间的相互作用(范德华力、静电力、排斥

2025-03-31 14:12

人工智能(AI)技术在极端气候事件预测和分析中扮演了重要角色,通过改进天气预报、模型仿真、参数估计和极端事件预测,显著提升了灾害响应与沟通效率。西班牙瓦伦西亚大学的研究团队强调了不同领域合作的必要性,以创建实用、可理解和值得信赖的AI解决方案,以增强灾难准备和降低风险。他们总结的研究方法以「Artificial intelligence for modeling and understanding extreme weather and climate events」为题,于2025年2月24日刊登于《Nature Communications》。 AI方法回顾:近年来,极端气候事件的频率、强度和持续时间都有所增加,对社会稳定、经济安全、生物多样性丧失和生态完整性构成了前所未有的挑战。为极端事件提供一个精确、正式、普遍适用的定义本身就很困难。在此背景下,人工智能(AI)已成为一种变革性的检测工具,极大便利了预测极端事件分析以及最坏情况事件的生成。机器学习(ML)和深度学习(DL)的功能,特别是与计算机视觉技术相结合,通过利用气候数据(例如再分析和观测)来推进事件的检测和定位。量化不确定性的技术对于目前来说是必要的,因此将AI模型带向集成已经推动了极端归因领域的发展。 用于极端事件建模的AI方法可以分为检测、预测、和影响评估。由于DL的出现和成功,所有这些任务都可以通过设计数据驱动模型来解决,这些模型利用时空和多源地球数据特性,从气候变量到原位测量和卫星遥感图像都有它们的存在。除开这些,设计能够准确模拟极端事件的预测系统对于预测未来极端事件的影响并为决策者提供关键信息以防止损害和损失至关重要。空间和时间预测旨在提供地球状态未来值的定量估计。 已经提出了许多ML算法来预测确定性极端事件,但大多数算法仅限于小区域和特定用例。可以单独使用气候变量进行预测或与卫星图像相结合。一种常见的方法是直接估计定义极端事件的指标。使用ML进行影响评估的另一种方法是分析PDF随时间的变化。这种方法可以量化不同事件的影响,有助于提高对脆弱性驱动因素的理解。或者,可以通过分析基于自然语言处理(NLP)的新闻报道以及最近的LLM来检测极端事件的影响。 极端事件理解和可信:可解释的AI(XAI)和不确定性量化(UQ)等学科提供了使AI更加可靠和值得信赖的方法。因果推理和极端事件归因等技术通过了解这些事件背后的机制,进一步补充了XAI和

2025-03-31 14:12

英伟达推出创新AI架构优化技术,解决大型语言模型推理效率瓶颈。该技术通过合并依赖性较低的FFN层为更宽的FFN,实现并行计算,显著提升推理速度和资源效率。实验表明,Ultra-253B-Base在批量大小为32时,推理延迟降低了1.71倍,每个token的计算成本降低了35倍。此外,Ultra-253B-Base在多个评测基准上取得了优异的成绩,内存使用量减少了一半。FFN融合技术已在不同规模的模型上得到验证,显示出良好的通用性。这项研究表明,通过深入分析和巧妙的架构设计,可以显著提升LLM的效率。

2025-03-31 14:11

CycleResearcher 是来自西湖大学和UCL等机构的研究团队在自动化科研方向发布的一项突破性成果。该研究首次实现了可训练的科研流程的全链路端到端训练,覆盖智能文献检索、模型主动提问、强化学习迭代优化论文创新点、方法论架构设计、实验设计到论文自动生成的完整闭环。 这项技术的主要亮点包括: 1. 通过强化学习实现科研过程的自动迭代改进,能够模拟完整的科研流程,包括文献综述、研究构思、论文撰写,以及模拟实验结果。 2. 发布了两个大规模数据集(Review-5k 和 Research-14k),用于评估和训练学术论文评审和生成模型。 3. CycleResearcher 模型能够生成质量接近人类撰写预印本的论文,实现 31.07% 的接受率。 4. CycleReviewer 模型能够模拟同行评议,对生成的论文进行评估和反馈。 5. 通过迭代反馈训练阶段,研究人员首先通过拒绝采样获取样本,通过 CycleReviewer 的打分构成偏好对,两个模型相互配合,通过强化学习的方式不断优化,CycleResearcher 根据 CycleReviewer 的反馈不断改进自身的论文生成策略,CycleReviewer 则根据 CycleResearcher 生成的论文不断提高自身的评审能力。 6. 实验结果显示,CycleResearcher 生成论文的模拟评审平均得分达到 5.36 分,超过目前 AI Scientist 的 4.31 分,且十分接近人类真实预印本的平均水平(5.24 分)。同时,CycleResearcher 论文的接受率达到了 35.13%,远高于 AI Scientist 的 0%。 7. 提供了完整的开源资源套件,包括不同规模模型、大规模训练数据集和详尽教程。 总之,CycleResearcher 是一项具有重要应用前景的技术,有望为科研人员提供更高效、准确的科研辅助工具。

2025-03-31 12:11

来自机器之心的AI技术文章《200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba》介绍了一个名为AReaL的开源强化学习训练框架,该框架由蚂蚁技术研究院和清华大学交叉信息院吴翼团队联合发布。AReaL旨在通过其创新的数据蒸馏技术和大规模强化学习训练,实现高效稳定的分布式训练,并让每个人都能以极低的成本实现最强的推理训练效果。 AReaL-boba是首个全面拥抱xAI公司所采用的SGLang推理框架的开源训练系统,对比初代AReaL训练大幅度提升训练吞吐。使用AReaL-boba即可以128张H800规模在1天内训练完成SOTA 1.5B推理模型,以256张H800规模在2天内完成SOTA 7B推理模型训练。此外,AReaL团队还开源了推理模型、所有的训练数据以及全部的训练脚本和评估脚本,确保人人可复现。 在最新的AReaL v0.2版本AReaL-boba中,其7B模型数学推理分数刷新同尺寸模型AIME分数纪录,并且仅仅使用200条数据复刻QwQ-32B,以不到200美金成本实现最强推理训练效果。

2025-03-31 12:11

千寻智能完成5.28亿元Pre-A轮融资,由阿美P7 Ventures领投,多家资本深度参与。公司成立于2024年,拥有顶尖团队,专注于具身智能领域,包括AI和机器人技术。其自研VLA Spirit v1抢先版在柔性物体操作上取得突破,即将发布Moz1人形机器人。千寻智能以“顶尖人才驱动颠覆性创新”为战略,加速构建产学研融合的人才体系,并致力于推动具身智能技术的全球发展。

2025-03-31 12:11

AI版论文搜索工具Ai2 PaperFinder推出,提供超过800万篇全文和1.08亿篇摘要,帮助用户快速找到相关研究。该平台通过强大的文献检索功能和文献合成功能,节省查阅时间,提升科研效率。同时,Ai2团队不断开发新功能,为科学家提供全面支持。

2025-03-31 12:11

联想首席技术官Tolga Kurtoglu在2025/26财年誓师大会上强调,AI行业正快速迭代,但尚未实现成熟能力为用户创造价值。Kurtoglu提出未来AI发展关键在于构建以用户为中心的解决方案,打造差异化优势。他描绘了未来AI图景:端侧、云端、边缘等多模型和智能体协同运作,提供简约体验与强大能力融合的AI服务。为实现这一愿景,联想将建立模型工厂,采用先进模型编排技术和智能体开发框架,提升AI智能体的部署速度和质量。这将使联想具备向用户交付超级AI智能体的能力。

2025-03-31 12:11

Meta公司因涉嫌使用未出版书籍训练AI模型引发关注,引发了对创作者权益及AI训练数据合法性的广泛讨论。

2025-03-31 12:11