漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-15 talkingdev

OpenAI推出BrowseComp基准测试:评估AI代理在线获取复杂信息的能力

OpenAI最新发布了名为BrowseComp的基准测试,包含1,266个问题,专门用于评估AI代理在互联网上搜集复杂且难以定位信息的能力。这一基准测试的推出标志着AI在信息检索领域的重要进展,尤其是在处理需要多步骤推理和跨...

Read More
2025-04-07 talkingdev

Meta发布Llama 4模型套件,新增四款人工智能模型

Meta公司新推出的Llama 4模型套件包含了四款全新的AI模型,分别是Maverick、Scout、Behemoth和Reasoning。Maverick与Scout两款模型现已开放下载,用户可以在Llama官网以及Hugging Face平台获取,并已集成至Meta AI系...

Read More
2025-04-07 talkingdev

[论文推荐]DeepSeek提出推理时缩放技术,革新通用奖励模型训练范式

DeepSeek最新研究论文《Inference-Time Scaling for Generalist Reward Modeling》提出了一种创新方法,通过推理时缩放技术优化奖励模型,从而引导更强大的推理模型生成。该技术标志着这家中国初创公司的一项战略布...

Read More
2025-03-27 talkingdev

揭秘大型语言模型的思维轨迹

随着人工智能技术的飞速发展,大型语言模型(LLM)的复杂性和能力不断提升,但其内部决策过程仍被视为“黑箱”。近日,研究人员通过先进的追踪技术,成功揭示了LLM在生成文本时的思维路径。这一突破不仅有助于提升模型...

Read More
2025-03-19 talkingdev

Roblox开源其生成式3D模型Cube,革新虚拟世界创作

Roblox近日宣布开源其生成式AI系统Cube,该系统专注于3D和4D模型的生成。Cube的Beta版本将被集成到Roblox Studio中,并作为Lua API供开发者使用。这一重大技术突破不仅展示了Roblox在生成式AI领域的深厚积累,更预示...

Read More
2025-03-10 talkingdev

概率人工智能:技术前沿与应用展望

概率人工智能(Probabilistic Artificial Intelligence)作为人工智能领域的重要分支,近年来在学术界和工业界引起了广泛关注。其核心思想是通过概率模型来处理不确定性问题,从而提升AI系统的决策能力和鲁棒性。与...

Read More
2025-02-27 talkingdev

AISafetyLab:全面AI安全框架开源,涵盖攻击、防御与评估

近日,AISafetyLab在GitHub上发布了一个全面的AI安全框架,旨在为研究人员和开发者提供一套完整的工具集,以应对AI系统中的安全问题。该框架不仅包含了多种模型和数据集,还提供了实用的工具和一系列与AI安全相关的...

Read More
2025-02-26 talkingdev

Character AI在NanoGPT中实现内存优化,KV缓存使用减少40%

近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page