OpenAI 在 ChatGPT 中推出全新图像生成器,显著提升图片编辑、文本渲染和空间表示功能。同时,公司放宽争议性内容限制,允许生成描绘公众人物、仇恨符号和种族特征的图像,此举被视为其“解除”ChatGPT 审查更大计划的一部分,旨在让模型处理更多请求,提供多样化视角。尽管 OpenAI 否认政策变化出于政治动机,称其反映了“长期以来给予用户更多控制权的信念”,且技术已足够成熟处理敏感话题,但此政策转变可能带来更广泛的影响,并可能使 OpenAI 在回应敏感问题时面临新的挑战。
2025-03-29 10:58
英国医生艾哈迈德·克尔万创立的Taxo公司,利用人工智能技术重塑医疗效率,完成500万美元种子轮融资。该公司通过透明AI“推理”引擎,提高医疗文书处理效率,获投方包括Y Combinator、General Catalyst和Character Capital。克尔万表示,该技术能向用户解释决策过程,赢得专业人士信任,去年底成为AI领域主流趋势。Taxo在OpenAI和Anthropic等模型基础上增加医疗专用层,利用专业医疗数据训练,竞争壁垒高。公司为15家客户提供服务,客户类型涵盖诊所到政府服务机构。
2025-03-29 10:58
GPT-4o 技术在视频制作中的应用展示了其强大的图像转视频能力,通过截取特定镜头并利用 GPT-4o 进行风格化处理,成功复刻了吉卜力动画的视觉效果。这一技术不仅提高了视觉内容的生成效率,还为创作者提供了更多的可能性和自由度。此外,可灵 AI 的辅助工具进一步优化了人物动作的流畅性和画面的稳定性,使得整个制作过程更加高效和专业。
2025-03-28 20:58
**摘要:** 在2025年开年的开源周中,机器之心与来自机器之心的明星创业公司VAST-AI共同宣布了他们的两大3D生成模型TripoSG和TripoSF的开源。这两个模型不仅代表了当前3D生成技术的最高水平,还为整个3D AI领域带来了新的技术突破和应用可能。 TripoSG是一个基础的3D生成模型,它在图像到3D网格的生成任务上远超所有闭源模型,其质量、细节和保真度都达到了业界最佳水平。TripoSG通过引入校正流(Rectified Flow)这一创新的架构,提供了从噪声数据到高质量3D网格的稳定训练方式,同时结合跳跃连接等关键增强设计,使得训练更加高效、稳定。此外,VAST团队还开发了一种高效的变分自编码器(VAE),采用符号距离函数(SDFs)进行几何表示,相较于传统的体素占用栅格方法,精度更高。 TripoSF则是一个更高级的版本,它不仅继承了TripoSG的所有优点,还在多个方面进行了优化和扩展。首先,TripoSF采用了稀疏体素结构来降低内存占用,支持任意拓扑结构的高分辨率重建。其次,TripoSF使用视锥体感知的分区体素训练策略,进一步提高了训练效率。最后,TripoSF还构建了一个变分自编码器(VAE),实现了从输入到输出的完整处理流程。 这些技术的开源,不仅让全球开发者能够直接访问和使用这些强大的3D生成工具,也推动了整个3D AI社区的发展。随着这些技术的不断成熟和完善,我们有理由相信,未来的3D生成技术将会带来更加丰富和真实的视觉体验,推动游戏、视频制作、工业设计等多个领域的创新和发展。
2025-03-28 18:58
MIT、哈佛与卡内基梅隆大学联合推出Lyra:高效生物序列建模新方法,显著减少参数需求并提升计算效率。该模型通过结合状态空间模型(SSM)和投影门控卷积(PGC),有效捕捉局部和全局依赖关系,实现两小时内完成训练。在100多个生物任务中表现优异,尤其在蛋白质适应度预测、RNA功能分析和CRISPR设计等领域达到最佳性能。此技术有望推动基础生物研究进展及实际应用,如治疗开发、病原体监测和生物制造等。
2025-03-28 18:58
香港科技大学与音乐领域的DeepSeek合作开发的开源音乐生成模型YuE正式发布,该模型能够生成多种风格的音乐并模拟人声,带来全新的音乐体验。YuE采用双LLaMA语言模型架构,可处理长达5分钟的完整歌曲,实现端到端生成。引入“双轨版下一token预测”策略和结构化渐进生成技术,确保音质和连贯性,避免内容重构过程中的信息损失。此外,YuE还开发了独特的音乐上下文学习技术,提高音乐性和创作独特性。在多项评测中展现出卓越表现,成功赢得用户好评。随着YuE的发布,音乐创作的未来将更加充满可能性。
2025-03-28 16:58
AI服务公司Manus宣布推出付费订阅模式,Starter套餐定价39美元/月,Pro套餐199美元/月。该计划允许用户同时运行两个任务并享有专属资源、扩展上下文长度及高峰时段优先访问权限。此外,用户可使用积分进行任务运行和解锁额外功能。Manus的定价策略反映了对用户需求的精准把握,为平台的持续发展建立了稳定的收入模式。
2025-03-28 16:58
英伟达计划收购AI初创公司Lepton AI,以加强其云计算和企业软件市场竞争力。此举标志着英伟达在与亚马逊、谷歌等云服务商的竞争中寻求突破。Lepton AI专注于简化AI模型构建与部署,提供Python SDK和云计算平台,旨在降低技术门槛并提高应用开发效率。贾扬清作为知名科学家,带领团队致力于解决AI基础设施层的问题,推动更多开发者和企业使用AI技术。
2025-03-28 16:58
腾讯元宝AI助手新增支持36种文件格式解析与处理,包括Word、PDF、Excel等常见文档及.py、.java、.json等开发文件。新功能允许用户上传文件并完成代码解读、审查、Bug定位、语法优化等操作,同时支持将代码转换成其他语言。此次更新是继接入DeepSeek V3-0324最新版和推出HTML代码实时预览功能后的第三次功能迭代,覆盖前端开发、脚本自动化、数据处理等场景。
2025-03-28 16:58
AI聊天机器人Therabot在一项针对抑郁症、广泛性焦虑症和饮食失调症患者的试验中显示出显著疗效。试验显示,参与者的症状平均减轻51%,情绪和整体幸福感显著提升;广泛性焦虑症患者症状减轻31%,许多人从中度焦虑降至轻度或诊断阈值以下。饮食失调症患者身体形象改善平均达19%。研究指出,Therabot提供的支持与传统治疗效果相当,尤其在资源短缺情况下。设计经过专业咨询,保护机制识别自残风险并提供紧急护理链接。用户与Therabot建立信任和情感联系,更愿意分享感受。研究成果发表在《新英格兰医学杂志》,为AI在心理健康领域的应用提供了新思路。
2025-03-28 16:58