嘿咯AI新闻

阿里巴巴国际集团在2026届校园招聘中将重点招募80%的AI相关职位,覆盖算法、研发及产品经理等领域。此举反映了阿里国际对人工智能技术的持续投资和技术创新,包括推出全球首个外贸领域的AI搜索引擎Accio,以及通过智能化升级提升电商平台效率。此外,阿里国际还推出了Bravo102计划,采用人才反选机制,展现了对高端AI人才的渴求及开放态度。

2025-04-07 18:43

商汤科技宣布,其AI基础设施SenseCore将进行升级,预计算力将实现指数级增长。自2021年推出以来,SenseCore整合了全国算力资源,在上海、深圳、广州等城市建立了新的计算节点。到2024年7月,SenseCore的总算力规模达到20000petaFLOPS,搭载超过5.4万块GPU,支持大模型研发和外部客户训练部署服务。此次升级将显著提升技术能力,特别是在AI基础设施、具身智能研发及行业大模型应用等方面,预计将实现指数级增长。

2025-04-07 18:43

音乐产业正面临AI技术带来的深度伪造威胁,唱片公司、艺术家和制作人正在通过各种渠道进行维权。索尼音乐已要求清除多达75,000个深度伪造内容,揭示了当前AI侵权问题的严峻程度。然而,面对这一现象,Spotify等科技巨头正在努力开发新工具以改善情况。此外,音乐产业还担忧未经授权使用其内容来训练生成式AI模型,以及立法领域进展缓慢。美国国会提出了几项法案,但尚未产生实质性结果。英国政府也在考虑修改法律,允许AI公司使用互联网上创作者的内容来帮助开发模型。分析师认为,只要音乐产业继续保持碎片化状态,AI问题就会持续困扰它。

2025-04-07 16:43

Kimi开放平台宣布对模型推理服务和上下文缓存价格进行下调,以提升技术能力并优化用户体验。此举基于Moonshot AI一年来的技术积累和性能优化,旨在降低企业与开发者接入大模型服务的门槛。价格调整包括模型推理服务普遍降价及上下文缓存显著下调,特别针对超长文本处理能力的提升。这一举措将推动人工智能服务的普及与应用,降低企业成本,提高开发效率。

2025-04-07 16:43

随着人工智能生成代码趋势的兴起,网络安全领域的CISO们开始担忧初级开发者对AI工具的过度依赖可能削弱其基本技能,带来长期风险。许多开发者将AI编码助手视为提高工作效率的工具,但这种便利也带来了长远的风险。微软的一项调查指出,依赖AI的员工在工作中更少进行质疑、分析和评估,这可能会影响他们的批判性思维能力。虽然AI工具在短期内可以提升效率,但从长远来看,这种依赖可能会削弱开发者的创新能力和技术适应能力。一些CISO对此表示忧虑,尤其是针对那些重度依赖AI工具的初级开发者,他们在工作中往往更关注代码能否运行,而非其工作原理。依赖AI生成的代码可能导致安全盲点,因为这些代码未必能满足组织的特定安全需求。此外,使用AI生成的代码也可能引发合规性和知识产权方面的法律问题,因为这类工具可能会不经意间引入未经验证或具有潜在风险的代码。随着AI技术的不断发展,组织必须采取适当的措施,以确保开发者在使用AI的同时,能够保持批判性思维和深厚的技术基础。

2025-04-07 16:43

DeepSeek与清华大学合作研发低成本AI模型,旨在降低训练成本并提高运营效率。通过创新的强化学习方法,该模型能在较少的数据和时间内达到更好的性能,有望推动AI技术的广泛应用和数字化转型。

2025-04-07 16:43

Meta公司因未经授权使用作家作品训练AI模型引发版权争议,约100名作家在伦敦总部外抗议。抗议者指责Meta侵犯知识产权,并要求政府介入。Meta否认侵权,称其做法符合法律。此事件凸显了创意产业对AI技术的需求和创作者权益保护的重要性。

2025-04-07 16:43

PartRM: 模型部分-level Dynamics with Large Cross-State Reconstruction Model

2025-04-07 14:43

MoCha是加拿大滑铁卢大学魏聪、陈文虎教授团队与Meta GenAI共同完成的一项突破性研究,旨在通过完全基于语音和文本的端到端训练,实现自动化多轮对话电影生成。这项技术能够生成高度准确的唇动同步效果,展现出精细的语音-视频对齐能力,并支持多角色对话生成,具备镜头语言与剧情连贯性。此外,该研究还提出了创新的注意力机制和联合训练策略,有效提升了模型在多样化角色动作下的泛化能力和真实感表现。

2025-04-07 14:42

文章标题:NoProp: TRAINING NEURAL NETWORKS WITHOUT BACK-PROPAGATION OR FORWARD-PROPAGATION 摘要: 近年来,深度学习模型的训练效率和可扩展性一直是研究热点。尽管反向传播(BP)是一种主流的训练方法,但它存在生物学合理性不足、内存消耗大、并行计算受限等缺点。因此,研究人员一直在寻找替代方案。最近,牛津大学和Mila实验室的研究者提出了一种名为NoProp的新型学习方法,它不依赖前向或反向传播,通过独立训练每层的噪声目标来去除噪声。这种方法在MNIST、CIFAR-10和CIFAR-100图像分类基准测试上展示了高效性和优越性。 关键词:深度学习;反向传播;无梯度学习;神经网络;NoProp 核心内容: NoProp是一种不需要前向或反向传播的新方法,它通过从扩散和流匹配(flow matching)方法中汲取灵感,利用每层独立地对噪声目标进行去噪,从而绕过了传统基于顺序梯度的贡献分配机制。这种方法的核心在于,它允许每层独立地对输入数据进行局部去噪处理,而不是依赖于前向或反向传播来传递梯度信息。 实验结果表明,NoProp在多个基准测试上的性能超过了传统的反向传播方法,包括离散时间设置与连续时间设置。此外,NoProp还显示出在减少GPU内存消耗方面的优势,这为大规模分布式训练提供了潜在优势。 总结: NoProp作为一种全新的训练策略,为深度学习模型提供了一种无需依赖传统梯度传播机制的新途径。虽然其实现细节较为复杂,但实验结果证明了其在提高训练效率和降低计算成本方面的潜力。未来,随着研究的深入和技术的进步,NoProp有望在实际应用中发挥更大的作用。

2025-04-07 14:42