漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-26 talkingdev

Character AI在NanoGPT中实现内存优化,KV缓存使用减少40%

近日,Character AI在其大规模推理系统中成功减少了KV缓存的使用,并在一个简化版的GPT模型中实现了这一优化。通过这一技术改进,内存使用量减少了40%。这一优化不仅提升了系统的运行效率,还为未来更大规模的AI模型...

Read More
2025-02-26 talkingdev

DeepSeek加速推出下一代R2模型以领先GPT-4.5

科技界瞩目的人工智能公司DeepSeek正加快步伐,提前推出其备受期待的R2模型。原先计划于5月初发布R2模型的DeepSeek,现决定提前发布日期。新一代R2模型有望在编码技能上有所提升,并且能够处理除英语外的其他语言。...

Read More
2025-02-21 talkingdev

OpenAI GPT-4.5下月或将发布,GPT-5紧随其后

据匿名消息源透露,人工智能技术公司OpenAI可能正在准备下周发布GPT-4.5,而下一代模型GPT-5也预计于5月问世。微软对GPT-5的期待尤为迫切,因为其年度开发者大会将于5月22日举行。尽管GPT-5可能在能力和效率上有所提...

Read More
2025-02-18 talkingdev

Elon Musk旗下xAI发布最新旗舰模型Grok 3,性能全面提升

xAI公司近日发布了其最新旗舰人工智能模型Grok 3,并展示了针对iOS和网页应用的新功能。Grok 3的训练使用了位于孟菲斯的庞大数据中心,该中心配备了约20万个GPU。Grok 3系列模型包括:Grok 3 mini,它以牺牲部分准确...

Read More
2025-02-13 talkingdev

OpenAI公布GPT-5路线图:GPT-4.5将成最后非链式思维模型

OpenAI近日公布了其GPT系列模型的未来发展路线图,计划在推出GPT-5之前,先发布GPT-4.5作为最后一个非链式思维(non-chain-of-thought)模型。GPT-5将实现o-series与GPT-series模型的统一,标志着OpenAI在大型语言模...

Read More
2025-02-04 talkingdev

OpenAI推出Deep Research:ChatGPT中的自主研究agent

OpenAI近日发布了名为“Deep Research”的自主研究agent,该agent集成于ChatGPT中,能够通过综合分析大量在线资源进行多步骤研究。Deep Research由即将推出的OpenAI o3模型的优化版本驱动,展现了AI在复杂任务处理中的...

Read More
2025-01-29 talkingdev

SmolGPT:基于PyTorch的轻量级LLM训练框架开源

近日,一款名为SmolGPT的轻量级PyTorch实现框架正式发布,旨在帮助开发者从零开始训练小型LLM(Large Language Model)。该框架以其简洁的设计和高效的性能吸引了广泛关注。SmolGPT通过优化模型结构和训练流程,显著...

Read More
2025-01-24 talkingdev

OpenAI推出全新AI代理Operator,实现浏览器自动化操作

OpenAI近日发布了名为Operator的全新AI代理,该代理能够通过与浏览器交互,执行诸如输入、点击和滚动等操作。Operator基于Computer-Using Agent (CUA)模型,结合了GPT-4的视觉能力和强化学习技术,使其能够在图形界...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page