嘿咯AI新闻

阿里云旗下AI开源社区魔搭(ModelScope)推出了全新的MCP广场,成为最大的中文MCP社区。该平台上架了千余款热门MCP服务,独家首发支付宝、MiniMax等全新服务,为AI开发者提供丰富的资源和工具,推动AI应用的创新和落地。

2025-04-15 13:23

AIR框架是一套系统化分析并优化偏好数据集的方法论,它通过简化标注、智能筛选指令和科学构建回复对,显著提升了大语言模型(LLMs)的偏好学习性能。该框架的核心在于将偏好数据集的设计转变为一种科学、关注组件优化的策略,从而在实际应用中取得了显著的性能提升。 首先,AIR框架通过极简标注策略,利用生成式奖励模型(如Llama-3.1-70B-Instruct)进行偏好标注,避免了复杂标注带来的过拟合问题,同时保持了足够的信息量以供模型学习。这一策略不仅提高了标注的效率,还确保了标注质量,为后续的偏好数据优化打下了坚实的基础。 其次,AIR框架中的智能指令筛选机制,基于动态质量方差分析,从多模型采样中选择评分方差最小的指令。这种筛选方法不仅考虑了指令本身的质量,还考虑了不同模型对同一指令响应的差异性,有效避免了因指令单一导致的偏好学习偏差。此外,通过对指令结构的扩展,如增加多轮对话指令,进一步提升了模型处理复杂对话的能力。 最后,AIR框架强调了科学构建回复对的重要性。通过设置合理的质量差(Δ=2/3),锚定高质量的基线回复,并通过三重黄金准则(合理质量差、锚定高质量基线、采用On/Off-Policy混合策略)精确控制策略分布偏移,确保了回复对的质量与策略多样性。这种平衡策略不仅提高了回复对的学习效果,还保证了模型在实际应用中的灵活性和可靠性。 综上所述,AIR框架通过系统性地分析和优化偏好数据集的三大核心要素——标注、指令和回复对,实现了对偏好学习的显著提升。这一创新不仅为偏好学习的科学化和系统化进程提供了新的思路和方法,也为构建高质量的偏好数据集、更智能、更可靠的AI系统奠定了坚实的基础。

2025-04-15 11:23

GPT-4.1 系列模型在多个关键性能指标上全面超越了 GPT-4o,包括编程、指令遵循和长上下文理解。这些改进不仅提升了模型的性能,还降低了成本和延迟,使其成为开发者和研究人员的理想选择。

2025-04-15 11:22

腾讯云大模型知识引擎迎来重大升级,正式支持模型上下文协议(MCP),允许用户通过知识引擎灵活调用平台精选的MCP插件或插入自定义插件,为开发者提供更高效、个性化的开发体验。这一更新显著提升了平台的开放性与扩展性,降低了定制化开发的复杂性,为中小企业和初创公司提供了更灵活的AI落地路径。

2025-04-15 11:22

AI行业新闻《Haisnap横空出世,小白用户也能轻松打造AI应用》报道了一款名为Haisnap的新型AI应用开发工具的发布。这款工具专为零基础用户提供,通过自然语言描述需求即可生成网页应用,并支持下载完整源代码。Haisnap利用多智能体协作机制,包括需求理解、代码生成、界面设计、测试与优化等模块,提高了开发效率和质量。其应用场景广泛,从娱乐到实用工具,如性格测试、随机推荐工具等。未来,Haisnap有望通过支持更多语言、集成多模态生成等功能,进一步推动AI技术与人类创造力的深度融合。

2025-04-15 11:22

智谱华章(以下简称“智谱”)宣布开源其新一代 GLM 系列大语言模型,包括32B 和9B 两种参数规模的模型。这些模型不仅在性能上与国际顶尖模型如DeepSeek R1相当,而且价格仅为后者的三分之一,为开发者提供了极大的自由度和商业应用潜力。此外,智谱还推出了基于这些模型的沉思模型,旨在探索人工智能的未来形态。 智谱此次开源活动的核心内容包括: 1. **开源规模**:智谱开源了包括32B和9B两种参数规模的模型,以及基座、推理和沉思三种类型的模型。所有模型均遵循宽松的MIT许可协议,允许开发者免费使用并自由分发。 2. **性能对比**:32B参数的GLM-Z1-32B-0414模型在部分任务上的性能媲美DeepSeek R1等拥有671B参数的顶尖模型,实测推理速度可达200Tokens/秒,是国内商业模型中最快的。而9B参数的GLM-Z1-9B-0414则在数学推理及通用任务上表现出色。 3. **应用场景**:智谱的开源模型适用于多种场景,从工程代码生成到函数调用,再到搜索问答和报告撰写等任务,都表现出色。特别是GLM-Z1-32B-0414在工程代码、Artifacts生成、函数调用等方面的表现尤为突出。 4. **平台支持**:智谱启用了全新的域名 Z.ai,并推出了基于这些模型的沉思模型,以提供更完整的研究闭环。同时,智谱 MaaS 开放平台也同步上线了基座和推理两类模型的 API 服务,为企业与开发者提供支持。 5. **政策影响**:智谱的开源活动受到了国内商业应用的影响,但同时也推动了国内AI技术的普及和应用。 总的来说,智谱的这次开源活动不仅展示了其在人工智能领域的技术实力,也为开发者提供了一个低成本、高性能的大语言模型资源库,有助于推动国内AI技术的发展和应用。

2025-04-15 11:22

AIbase报道,Cursor和Windsurf两大AI开发工具宣布全面开放GPT-4.1模型,以提升开发者的编码效率。这一举措不仅增强了代码生成和理解能力,还通过提供轻量化界面和快速响应的AI助手,进一步优化了用户体验。开发者社区对此反应热烈,并分享了利用新模型完成复杂堆栈应用和优化继承代码的案例。此举推动了AI驱动开发的普及,预计未来Cursor与Windsurf可能会进一步整合GPT-4.1模型,为不同需求的开发者提供更灵活的选择。

2025-04-15 11:22

支付宝与魔搭社区合作推出“支付MCP Server”,助力AI开发者快速接入支付能力,实现AI智能体内支付。该服务支持移动端和网页端,提供全流程支付管理,包括查询、退款等服务。此举将加速AI技术在商业领域的应用,推动支付基础设施向更智能高效方向发展。

2025-04-15 11:22

清华大学发布的GLM4,一款32亿参数的语言模型,在多个基准测试中表现出色,尤其是在指令跟随和任务自动化领域。该模型通过其MIT许可证,使得高性能AI解决方案更易于获取,适合研究和企业应用。

2025-04-15 09:22

谷歌近日发布了一款名为DolphinGemma的人工智能模型,旨在深入理解野生大西洋斑点海豚的交流模式。该模型基于谷歌与野生海豚项目(WDP)和佐治亚理工学院研究人员合作开发的庞大海豚音频和视频记录数据库进行训练。DolphinGemma能够识别、分析甚至生成逼真的海豚声音模式序列,包括口哨声、咔哒声和脉冲串声,其功能类似于人类语言模型,可以预测声音序列中的下一个声音。研究人员正利用谷歌Pixel智能手机将DolphinGemma直接部署到水下,进行实地数据记录和分析。这项创新性的研究计划结合了人工智能、移动技术和长期的实地观察,目标是揭示海豚语言的结构,并最终实现某种形式的人类与海豚之间的交流。

2025-04-15 09:21