嘿咯AI新闻

AI Scientist-v2 在 ICLR 2025 上提交的论文《Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization》获得了6/7/6的同行评审分数,超过了平均接受阈值,表现优于部分人类撰写的论文。这一成就标志着 AI Scientist 系列在自动化科学研究和开放式发现方面迈出了重要一步。 AI Scientist-v2 的技术创新包括: 1. 更大的自主性和泛化能力,通过更通用的想法生成阶段和消除对固定、人工编写实验模板代码的依赖。 2. 引入了基于智能体树搜索的探索方法,简化了稿件撰写阶段,并使用视觉语言模型(VLM)进行图表可视化和评审。 3. 利用 Hugging Face Hub 数据集,并整合了 VLM 来提高生成稿件的视觉清晰度和连贯性。 这些技术的进步预示着下一代 AI Scientist 将开启科学的新纪元,人工智能的能力可能会持续提升,甚至可能以指数级的速度增长。

2025-04-09 14:52

单细胞蛋白质组学(SCP)通过分析单个细胞中的蛋白质表达,揭示了细胞内复杂的生物过程。自2020年以来,质谱技术在灵敏度方面实现了显著提升,这得益于仪器设计的改进和结合机器学习的数据处理算法。尽管SCP在吞吐量和深度上仍受限制,但近期的研究利用Orbitrap Astral质谱仪,结合了传统与新型分析器,实现了对单个HeLa细胞中一半蛋白质组的量化,提高了50-120个细胞/天的处理能力。这些进展标志着SCP在精确绘制蛋白质组调控图谱方面取得了重大飞跃。

2025-04-09 14:52

火山引擎推出Data Agent,一款基于大模型的企业数据智能体,能够深度理解业务需求并自动化完成撰写深度研究报告、营销活动设计等任务。Data Agent致力于成为企业的“AI数据专家”,通过自主思考和数据洞察,为每位用户匹配触达时机、通道及内容,并提供智能会话辅助。在2024年一场公开活动中,谭待表示,“数据驱动未来的关键方向是智能化,在数据的建设、治理、分析场景中应用大模型技术,可以实现效率的提升。”预计Data Agent将于4月底开放首轮体验测试,目前已面向企业客户开启预约。

2025-04-09 14:52

Waymo计划利用车内摄像头数据训练AI模型,并可能用于定向广告。加州消费者隐私法案规定用户有权选择退出数据共享及AI训练。Waymo是Alphabet旗下专注于自动驾驶汽车研发的子公司,拥有约700辆自动驾驶出租车,并计划将服务扩展至更多城市的高速公路。

2025-04-09 14:52

广汽集团宣布其第三代具身人形机器人GoMate将于2026年实现量产,并计划在全球范围内进行批量发售。该机器人已在安防领域应用,未来将拓展至汽车生产线及后服务市场等领域。GoMate采用“轮足结合”构型设计,具备高效的运动控制能力和多模态感知技术,能够执行复杂任务。此外,GoMate的自研核心部件均具备较强竞争力,且已制定明确的量产计划。

2025-04-09 14:52

阿里巴巴和腾讯宣布全面支持Model Context Protocol(MCP),标志着中国AI行业在技术标准上的重大进步。这一协议旨在简化AI模型与外部工具的交互,提升互操作性,使AI代理能够无缝调用搜索、数据分析等服务。此举不仅反映了中国科技巨头在全球AI标准竞争中的战略意图,也预示着中国在全球AI技术领域的影响力增强。然而,MCP的普及之路仍面临挑战,包括生态成熟度、企业实现方式的差异以及兼容性与安全性问题。

2025-04-09 14:51

这篇文章主要介绍了一个名为MAYE的框架,它旨在提高机器学习在视觉语言模型(VLM)领域的透明度、可复现性、可教学性和可观察性。文章的核心贡献包括: 1. 提出了一种简洁透明的RL for VLM训练架构,该架构不依赖于复杂的黑箱封装和多余的抽象,而是直接基于Transformers、FSDP2和vLLM构建,专为VLM设计。 2. 实现了一个标准化评估方案,用于系统追踪训练动态和模型行为演化,包括准确率曲线、响应长度、多次独立运行取均值等指标,以清晰展示训练过程和模型行为。 3. 通过实证研究发现,输出长度的变化与模型推理策略的演化高度相关,但大多数性能提升并非源于长文本本身,而可能只是训练过程中的随机漂移或复读堆叠。 4. MAYE不仅提供了一个清晰的实验框架,还鼓励研究者采用多次独立运行报告结果,推动机器学习在VLM领域的研究从“能跑通”迈向“可分析、可信任”。 5. 论文与代码资源全面开源,欢迎研究者探索和复现。

2025-04-09 12:51

来自机器之心的AI技术文章《全日程揭晓!ICLR 2025论文分享会我们北京见》揭示了大语言模型(LLM)和多模态大模型在人工智能领域的快速发展,特别是在智能体、训练推理和Agent方面的应用。文章指出,随着技术的不断进步,这些模型正在推动从语言智能到认知智能的进程,为未来的人工智能奠定了重要基础。同时,学界对大语言模型范式的探索仍在继续,扩散模型不断向主流自回归架构发起挑战。 为了全面了解AI社区的最新创新成果和发展趋势,机器之心计划于4月20日在北京举办「ICLR 2025 论文分享会」。本次分享会将邀请顶级专家、论文作者与现场参会观众共同交流,主题涵盖训练推理、多模态、Agent等热门话题。作为机器学习和深度学习领域的顶级会议,ICLR每年都会吸引大量研究机构和高校参会,今年共接收11,565份投稿,录用率为32.08%。 分享会设置了Keynote、论文分享、圆桌对话、Poster交流等丰富环节,旨在为国内AI人才打造一个交流平台。Keynote嘉宾将介绍近似梯度下降理论及其在高效训练推理中的应用,而李崇轩则聚焦于LLaDA:语言模型新范式,挑战自回归是否是通向当前乃至更高水平的生成式智能的唯一范式。此外,还有一批论文作者进行论文分享与Poster展示。 合作伙伴黄大年茶思屋科技网站和腾讯青云计划也将参与此次分享会,提供技术支持和资源对接。真格基金和博世集团也分别介绍了他们的投资方向和业务发展情况。

2025-04-09 12:51

谷歌Gemini平台推出增强版的Deep Research功能,面向付费用户,提供AI驱动的深度信息整理与报告生成。该功能基于Gemini2.5Pro模型,显著提升推理能力和信息整合质量,支持移动端访问,每月可生成有限次数报告。此外,新增Audio Overviews功能,将研究报告转化为播客风格音频内容,目前仅支持英语,未来计划增加多语言支持。此举标志着Gemini从通用AI助手向专业研究工具的转型,加速其在教育、商业和技术领域的应用渗透。

2025-04-09 12:51

AI技术在媒体行业的应用引发了争议,尤其是当它被用于生成低质量的内容时。Quartz, 一家曾经备受尊敬的商业出版物,因使用AI生成内容而陷入困境,最终被廉价出售,其编辑团队几乎全军覆没。这一事件再次提醒媒体行业,盲目拥抱劣质AI可能带来的毁灭性后果。

2025-04-09 12:51