Databricks 推出的 TAO 技术,通过利用测试时计算和强化学习算法,无需标注数据即可提升 LLM 的性能。这一突破性方法不仅提高了模型质量,还降低了企业级任务的执行成本。TAO 在文档问答和 SQL 生成等专业任务中的表现优于传统微调方法,将 Llama 8B/70B 等开源模型提升至 GPT-4o/o3-mini1 等商业模型的水平,且无需任何人工标注数据。此外,TAO 还能自动生成训练数据,使模型随着使用频次增加而持续进化。实验表明,TAO 能够显著提升 LLM 在多个企业任务上的性能,与 o1、o3 和 R1 等依赖测试时计算的模型相比,具有更低的推理成本。
2025-03-30 20:07
GPT-4o 在图像生成和编辑方面展现出了显著的能力,尤其是其“画笔”功能,允许用户通过简单的指令修改图片。此外,该模型还具备推理能力,能够显示生成过程的思维链,预示着未来可能整合推理与非推理模型。OpenAI 的这一进展不仅提升了 AI 技术的应用范围,也引发了关于 AI 未来发展模式的讨论。
2025-03-30 17:26
Midjourney与纽约大学研究人员合作,开发出一种提升语言模型创意文本多样性的新方法。通过引入偏差指标,并利用嵌入文本及其成对余弦距离计算差异,新训练方法显著提高了输出的多样性。实验结果显示,改进后的模型在故事质量和多样性方面均优于其他模型,且仅需四个不同的响应即可显著提升模型的多样性。尽管前景可期,但仍有一些问题需要进一步探索,如是否适用于创意写作以外的领域以及在线训练环境中的有效性。研究人员表示,他们将在GitHub上公开分享他们的代码,以供其他研究人员和开发者借鉴。
2025-03-30 11:01
讯飞医疗发布全球首个“1型糖尿病专病大模型”,超越GPT-4o,助力精准诊疗。该模型由国家“四大慢病”重大专项核心成果转化,聚焦1型糖尿病诊疗关键痛点,整合多模态数据与临床经验,构建数智化防控体系。权威知识中枢、动态感知网络和决策支持引擎三重智能支撑体系全面提升诊疗水平。在预防、诊断、治疗等65个应用场景测试中效果超越通用大模型GPT-4o和DeepSeek-R1,为1型糖尿病患者带来希望,预示着人工智能在慢性病管理领域将发挥越来越重要的作用。
2025-03-30 11:00
OpenAI的ChatGPT因模仿吉卜力风格而引发版权争议,面临法律挑战。用户生成类似动画风格的请求遭拒绝,引发了关于人工智能使用和版权法的激烈讨论。批评者认为,这种行为侵犯了人类艺术家和出版商的劳动成果。吉卜力工作室可能有权要求赔偿,并可能对OpenAI提起诉讼。目前尚不清楚吉卜力是否会采取法律行动,但这一事件凸显了人工智能在商业应用中可能面临的法律风险。
2025-03-29 12:58
埃隆·马斯克旗下人工智能初创公司xAI与X宣布合并,估值飙升至800亿美元。此举旨在整合尖端AI技术和X的用户基础,释放潜力。两家公司由马斯克控股,现有投资者将获得相应比例的xAI股份。xAI计划在田纳西州孟菲斯市建造名为“巨像”的超级计算机,专门用于训练Grok。此次合并将提升马斯克在人工智能领域的竞争力,加速AI帝国版图扩张。
2025-03-29 10:58
OpenAI 在 ChatGPT 中推出全新图像生成器,显著提升图片编辑、文本渲染和空间表示功能。同时,公司放宽争议性内容限制,允许生成描绘公众人物、仇恨符号和种族特征的图像,此举被视为其“解除”ChatGPT 审查更大计划的一部分,旨在让模型处理更多请求,提供多样化视角。尽管 OpenAI 否认政策变化出于政治动机,称其反映了“长期以来给予用户更多控制权的信念”,且技术已足够成熟处理敏感话题,但此政策转变可能带来更广泛的影响,并可能使 OpenAI 在回应敏感问题时面临新的挑战。
2025-03-29 10:58
英国医生艾哈迈德·克尔万创立的Taxo公司,利用人工智能技术重塑医疗效率,完成500万美元种子轮融资。该公司通过透明AI“推理”引擎,提高医疗文书处理效率,获投方包括Y Combinator、General Catalyst和Character Capital。克尔万表示,该技术能向用户解释决策过程,赢得专业人士信任,去年底成为AI领域主流趋势。Taxo在OpenAI和Anthropic等模型基础上增加医疗专用层,利用专业医疗数据训练,竞争壁垒高。公司为15家客户提供服务,客户类型涵盖诊所到政府服务机构。
2025-03-29 10:58
GPT-4o 技术在视频制作中的应用展示了其强大的图像转视频能力,通过截取特定镜头并利用 GPT-4o 进行风格化处理,成功复刻了吉卜力动画的视觉效果。这一技术不仅提高了视觉内容的生成效率,还为创作者提供了更多的可能性和自由度。此外,可灵 AI 的辅助工具进一步优化了人物动作的流畅性和画面的稳定性,使得整个制作过程更加高效和专业。
2025-03-28 20:58
**摘要:** 在2025年开年的开源周中,机器之心与来自机器之心的明星创业公司VAST-AI共同宣布了他们的两大3D生成模型TripoSG和TripoSF的开源。这两个模型不仅代表了当前3D生成技术的最高水平,还为整个3D AI领域带来了新的技术突破和应用可能。 TripoSG是一个基础的3D生成模型,它在图像到3D网格的生成任务上远超所有闭源模型,其质量、细节和保真度都达到了业界最佳水平。TripoSG通过引入校正流(Rectified Flow)这一创新的架构,提供了从噪声数据到高质量3D网格的稳定训练方式,同时结合跳跃连接等关键增强设计,使得训练更加高效、稳定。此外,VAST团队还开发了一种高效的变分自编码器(VAE),采用符号距离函数(SDFs)进行几何表示,相较于传统的体素占用栅格方法,精度更高。 TripoSF则是一个更高级的版本,它不仅继承了TripoSG的所有优点,还在多个方面进行了优化和扩展。首先,TripoSF采用了稀疏体素结构来降低内存占用,支持任意拓扑结构的高分辨率重建。其次,TripoSF使用视锥体感知的分区体素训练策略,进一步提高了训练效率。最后,TripoSF还构建了一个变分自编码器(VAE),实现了从输入到输出的完整处理流程。 这些技术的开源,不仅让全球开发者能够直接访问和使用这些强大的3D生成工具,也推动了整个3D AI社区的发展。随着这些技术的不断成熟和完善,我们有理由相信,未来的3D生成技术将会带来更加丰富和真实的视觉体验,推动游戏、视频制作、工业设计等多个领域的创新和发展。
2025-03-28 18:58