嘿咯AI新闻 - 嘿咯图床的一句话AI新闻

Databricks 推出的 TAO 技术，通过利用测试时计算和强化学习算法，无需标注数据即可提升 LLM 的性能。这一突破性方法不仅提高了模型质量，还降低了企业级任务的执行成本。TAO 在文档问答和 SQL 生成等专业任务中的表现优于传统微调方法，将 Llama 8B/70B 等开源模型提升至 GPT-4o/o3-mini1 等商业模型的水平，且无需任何人工标注数据。此外，TAO 还能自动生成训练数据，使模型随着使用频次增加而持续进化。实验表明，TAO 能够显著提升 LLM 在多个企业任务上的性能，与 o1、o3 和 R1 等依赖测试时计算的模型相比，具有更低的推理成本。

2025-03-30 20:07

GPT-4o 在图像生成和编辑方面展现出了显著的能力，尤其是其“画笔”功能，允许用户通过简单的指令修改图片。此外，该模型还具备推理能力，能够显示生成过程的思维链，预示着未来可能整合推理与非推理模型。OpenAI 的这一进展不仅提升了 AI 技术的应用范围，也引发了关于 AI 未来发展模式的讨论。

2025-03-30 17:26

Midjourney与纽约大学研究人员合作，开发出一种提升语言模型创意文本多样性的新方法。通过引入偏差指标，并利用嵌入文本及其成对余弦距离计算差异，新训练方法显著提高了输出的多样性。实验结果显示，改进后的模型在故事质量和多样性方面均优于其他模型，且仅需四个不同的响应即可显著提升模型的多样性。尽管前景可期，但仍有一些问题需要进一步探索，如是否适用于创意写作以外的领域以及在线训练环境中的有效性。研究人员表示，他们将在GitHub上公开分享他们的代码，以供其他研究人员和开发者借鉴。

2025-03-30 11:01

讯飞医疗发布全球首个“1型糖尿病专病大模型”，超越GPT-4o，助力精准诊疗。该模型由国家“四大慢病”重大专项核心成果转化，聚焦1型糖尿病诊疗关键痛点，整合多模态数据与临床经验，构建数智化防控体系。权威知识中枢、动态感知网络和决策支持引擎三重智能支撑体系全面提升诊疗水平。在预防、诊断、治疗等65个应用场景测试中效果超越通用大模型GPT-4o和DeepSeek-R1，为1型糖尿病患者带来希望，预示着人工智能在慢性病管理领域将发挥越来越重要的作用。

2025-03-30 11:00

OpenAI的ChatGPT因模仿吉卜力风格而引发版权争议，面临法律挑战。用户生成类似动画风格的请求遭拒绝，引发了关于人工智能使用和版权法的激烈讨论。批评者认为，这种行为侵犯了人类艺术家和出版商的劳动成果。吉卜力工作室可能有权要求赔偿，并可能对OpenAI提起诉讼。目前尚不清楚吉卜力是否会采取法律行动，但这一事件凸显了人工智能在商业应用中可能面临的法律风险。

2025-03-29 12:58

埃隆·马斯克旗下人工智能初创公司xAI与X宣布合并，估值飙升至800亿美元。此举旨在整合尖端AI技术和X的用户基础，释放潜力。两家公司由马斯克控股，现有投资者将获得相应比例的xAI股份。xAI计划在田纳西州孟菲斯市建造名为“巨像”的超级计算机，专门用于训练Grok。此次合并将提升马斯克在人工智能领域的竞争力，加速AI帝国版图扩张。

2025-03-29 10:58

OpenAI 在 ChatGPT 中推出全新图像生成器，显著提升图片编辑、文本渲染和空间表示功能。同时，公司放宽争议性内容限制，允许生成描绘公众人物、仇恨符号和种族特征的图像，此举被视为其“解除”ChatGPT 审查更大计划的一部分，旨在让模型处理更多请求，提供多样化视角。尽管 OpenAI 否认政策变化出于政治动机，称其反映了“长期以来给予用户更多控制权的信念”，且技术已足够成熟处理敏感话题，但此政策转变可能带来更广泛的影响，并可能使 OpenAI 在回应敏感问题时面临新的挑战。

2025-03-29 10:58

英国医生艾哈迈德·克尔万创立的Taxo公司，利用人工智能技术重塑医疗效率，完成500万美元种子轮融资。该公司通过透明AI“推理”引擎，提高医疗文书处理效率，获投方包括Y Combinator、General Catalyst和Character Capital。克尔万表示，该技术能向用户解释决策过程，赢得专业人士信任，去年底成为AI领域主流趋势。Taxo在OpenAI和Anthropic等模型基础上增加医疗专用层，利用专业医疗数据训练，竞争壁垒高。公司为15家客户提供服务，客户类型涵盖诊所到政府服务机构。

2025-03-29 10:58

GPT-4o 技术在视频制作中的应用展示了其强大的图像转视频能力，通过截取特定镜头并利用 GPT-4o 进行风格化处理，成功复刻了吉卜力动画的视觉效果。这一技术不仅提高了视觉内容的生成效率，还为创作者提供了更多的可能性和自由度。此外，可灵 AI 的辅助工具进一步优化了人物动作的流畅性和画面的稳定性，使得整个制作过程更加高效和专业。

2025-03-28 20:58

**摘要：** 在2025年开年的开源周中，机器之心与来自机器之心的明星创业公司VAST-AI共同宣布了他们的两大3D生成模型TripoSG和TripoSF的开源。这两个模型不仅代表了当前3D生成技术的最高水平，还为整个3D AI领域带来了新的技术突破和应用可能。 TripoSG是一个基础的3D生成模型，它在图像到3D网格的生成任务上远超所有闭源模型，其质量、细节和保真度都达到了业界最佳水平。TripoSG通过引入校正流（Rectified Flow）这一创新的架构，提供了从噪声数据到高质量3D网格的稳定训练方式，同时结合跳跃连接等关键增强设计，使得训练更加高效、稳定。此外，VAST团队还开发了一种高效的变分自编码器（VAE），采用符号距离函数（SDFs）进行几何表示，相较于传统的体素占用栅格方法，精度更高。 TripoSF则是一个更高级的版本，它不仅继承了TripoSG的所有优点，还在多个方面进行了优化和扩展。首先，TripoSF采用了稀疏体素结构来降低内存占用，支持任意拓扑结构的高分辨率重建。其次，TripoSF使用视锥体感知的分区体素训练策略，进一步提高了训练效率。最后，TripoSF还构建了一个变分自编码器（VAE），实现了从输入到输出的完整处理流程。这些技术的开源，不仅让全球开发者能够直接访问和使用这些强大的3D生成工具，也推动了整个3D AI社区的发展。随着这些技术的不断成熟和完善，我们有理由相信，未来的3D生成技术将会带来更加丰富和真实的视觉体验，推动游戏、视频制作、工业设计等多个领域的创新和发展。

2025-03-28 18:58