GPT-4o 技术在视频制作中的应用展示了其强大的图像转视频能力,通过截取特定镜头并利用 GPT-4o 进行风格化处理,成功复刻了吉卜力动画的视觉效果。这一技术不仅提高了视觉内容的生成效率,还为创作者提供了更多的可能性和自由度。此外,可灵 AI 的辅助工具进一步优化了人物动作的流畅性和画面的稳定性,使得整个制作过程更加高效和专业。
2025-03-28 20:58
**摘要:** 在2025年开年的开源周中,机器之心与来自机器之心的明星创业公司VAST-AI共同宣布了他们的两大3D生成模型TripoSG和TripoSF的开源。这两个模型不仅代表了当前3D生成技术的最高水平,还为整个3D AI领域带来了新的技术突破和应用可能。 TripoSG是一个基础的3D生成模型,它在图像到3D网格的生成任务上远超所有闭源模型,其质量、细节和保真度都达到了业界最佳水平。TripoSG通过引入校正流(Rectified Flow)这一创新的架构,提供了从噪声数据到高质量3D网格的稳定训练方式,同时结合跳跃连接等关键增强设计,使得训练更加高效、稳定。此外,VAST团队还开发了一种高效的变分自编码器(VAE),采用符号距离函数(SDFs)进行几何表示,相较于传统的体素占用栅格方法,精度更高。 TripoSF则是一个更高级的版本,它不仅继承了TripoSG的所有优点,还在多个方面进行了优化和扩展。首先,TripoSF采用了稀疏体素结构来降低内存占用,支持任意拓扑结构的高分辨率重建。其次,TripoSF使用视锥体感知的分区体素训练策略,进一步提高了训练效率。最后,TripoSF还构建了一个变分自编码器(VAE),实现了从输入到输出的完整处理流程。 这些技术的开源,不仅让全球开发者能够直接访问和使用这些强大的3D生成工具,也推动了整个3D AI社区的发展。随着这些技术的不断成熟和完善,我们有理由相信,未来的3D生成技术将会带来更加丰富和真实的视觉体验,推动游戏、视频制作、工业设计等多个领域的创新和发展。
2025-03-28 18:58
MIT、哈佛与卡内基梅隆大学联合推出Lyra:高效生物序列建模新方法,显著减少参数需求并提升计算效率。该模型通过结合状态空间模型(SSM)和投影门控卷积(PGC),有效捕捉局部和全局依赖关系,实现两小时内完成训练。在100多个生物任务中表现优异,尤其在蛋白质适应度预测、RNA功能分析和CRISPR设计等领域达到最佳性能。此技术有望推动基础生物研究进展及实际应用,如治疗开发、病原体监测和生物制造等。
2025-03-28 18:58
香港科技大学与音乐领域的DeepSeek合作开发的开源音乐生成模型YuE正式发布,该模型能够生成多种风格的音乐并模拟人声,带来全新的音乐体验。YuE采用双LLaMA语言模型架构,可处理长达5分钟的完整歌曲,实现端到端生成。引入“双轨版下一token预测”策略和结构化渐进生成技术,确保音质和连贯性,避免内容重构过程中的信息损失。此外,YuE还开发了独特的音乐上下文学习技术,提高音乐性和创作独特性。在多项评测中展现出卓越表现,成功赢得用户好评。随着YuE的发布,音乐创作的未来将更加充满可能性。
2025-03-28 16:58
AI服务公司Manus宣布推出付费订阅模式,Starter套餐定价39美元/月,Pro套餐199美元/月。该计划允许用户同时运行两个任务并享有专属资源、扩展上下文长度及高峰时段优先访问权限。此外,用户可使用积分进行任务运行和解锁额外功能。Manus的定价策略反映了对用户需求的精准把握,为平台的持续发展建立了稳定的收入模式。
2025-03-28 16:58
英伟达计划收购AI初创公司Lepton AI,以加强其云计算和企业软件市场竞争力。此举标志着英伟达在与亚马逊、谷歌等云服务商的竞争中寻求突破。Lepton AI专注于简化AI模型构建与部署,提供Python SDK和云计算平台,旨在降低技术门槛并提高应用开发效率。贾扬清作为知名科学家,带领团队致力于解决AI基础设施层的问题,推动更多开发者和企业使用AI技术。
2025-03-28 16:58
腾讯元宝AI助手新增支持36种文件格式解析与处理,包括Word、PDF、Excel等常见文档及.py、.java、.json等开发文件。新功能允许用户上传文件并完成代码解读、审查、Bug定位、语法优化等操作,同时支持将代码转换成其他语言。此次更新是继接入DeepSeek V3-0324最新版和推出HTML代码实时预览功能后的第三次功能迭代,覆盖前端开发、脚本自动化、数据处理等场景。
2025-03-28 16:58
AI聊天机器人Therabot在一项针对抑郁症、广泛性焦虑症和饮食失调症患者的试验中显示出显著疗效。试验显示,参与者的症状平均减轻51%,情绪和整体幸福感显著提升;广泛性焦虑症患者症状减轻31%,许多人从中度焦虑降至轻度或诊断阈值以下。饮食失调症患者身体形象改善平均达19%。研究指出,Therabot提供的支持与传统治疗效果相当,尤其在资源短缺情况下。设计经过专业咨询,保护机制识别自残风险并提供紧急护理链接。用户与Therabot建立信任和情感联系,更愿意分享感受。研究成果发表在《新英格兰医学杂志》,为AI在心理健康领域的应用提供了新思路。
2025-03-28 16:58
艾伦研究所和清华大学的联合研究团队揭示了大脑状态如何动态调节神经编码,通过分析LFP频谱特征和视觉系统变异性,发现不同状态下的神经元反应存在显著差异。他们建立了基于脑状态的变异性解析框架,揭示了神经编码的动态本质,并提出了未来展望。
2025-03-28 14:58
vivo宣布进军机器人领域,旨在利用AI和影像技术打造家庭智能助手。该公司在博鳌亚洲论坛2025年年会上宣布成立“vivo机器人实验室”,致力于研发能够理解环境并响应用户需求的机器人。vivo计划将自研的混合现实头显与AI技术结合,以提升用户体验。公司已开始招聘相关领域的人才,预计在未来三到五年内推出原型机和商用产品。vivo的成功得益于其在手机制造方面的深厚积累和技术实力,以及强大的产业链整合能力。
2025-03-28 14:58