漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-05 talkingdev

Qodo发布首个真实场景AI代码审查基准测试,客观评估工具性能

近日,Qodo公司宣布开发出一套全新的、严谨的AI代码审查基准测试方法,旨在对各类AI辅助代码审查系统进行客观、量化的性能评估。该基准测试的创新之处在于,其并非使用人工构造的简单代码片段,而是将多种类型的缺陷...

Read More
2026-02-04 talkingdev

论文推荐|SWE-Universe:从GitHub PR构建百万级可验证软件工程环境

近日,一项名为SWE-Universe的研究提出了一种革命性的可扩展框架,旨在从GitHub的拉取请求中自动构建真实世界的软件工程可验证环境。该研究成功解决了自动化构建中长期存在的三大挑战:构建成功率低、验证机制薄弱以...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2026-01-26 talkingdev

开源|字节跳动Seed团队发布Stable-DiffCoder:基于扩散模型的轻量级代码大语言模型

字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...

Read More
2026-01-16 talkingdev

开源|DASD:序列蒸馏技术打造高效推理模型,4B/30B版本在代码、数学与科学基准测试中表现强劲

近日,由D2I-ai团队在GitHub上开源的DASD(序列蒸馏)项目,提出了一种创新的模型蒸馏流程,旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术,通过精细化的知...

Read More
2025-12-29 talkingdev

Unity Mono性能瓶颈深度剖析:为何你的C#代码运行效率远低于预期?

近期,一篇技术分析文章在开发者社区引发广泛讨论,直指Unity游戏引擎中长期使用的Mono运行时存在的严重性能问题。作者通过详尽的基准测试发现,在Unity Mono环境下运行的C#代码,其执行速度相较于现代.NET运行时存...

Read More
2025-12-23 talkingdev

开源模型新突破:MiniMax M2.1正式登陆Kilo平台,多项基准测试超越DeepSeek与Kimi

人工智能开源领域迎来重要进展。知名开源力量MiniMax推出的最新模型M2.1现已正式在Kilo平台上线。根据官方信息,M2.1在多项关键基准测试中表现优异,其性能已超越国内同行DeepSeek和Kimi等知名模型。更值得关注的是...

Read More
2025-12-23 talkingdev

智谱AI发布GLM-4.7:新一代开源编码模型刷新SOTA,推理与多模态能力全面升级

近日,智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型,GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本,此次更新在多个维度实现了显...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page