漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-19 talkingdev

ParScale开源LLM扩展范式-训练与推理并行计算

人工智能领域迎来重大技术突破,开源项目ParScale通过创新性地在大型语言模型(LLM)的训练和推理阶段同时应用并行计算技术,成功建立了第三种LLM扩展范式。这一技术突破解决了传统序列计算模式在超大规模模型应用中...

Read More
2025-05-16 talkingdev

Windsurf发布自研编程模型家族,剑指通用大模型性能超越

在被OpenAI收购后,Windsurf正式推出全新编程专用模型家族:旗舰级SWE-1(性能对标Claude Sonnet 3.5)、无使用限制的SWE-1-lite以及轻量版SWE-1-mini。该公司宣称,这些基于非完整代码状态和多工作界面训练的专业模...

Read More
2025-05-13 talkingdev

模块化多语言大模型Helium 1发布:20亿参数专攻欧洲语言,支持端侧部署

法国研究机构Kyutai最新推出的Helium 1大语言模型以20亿参数的轻量化架构实现技术突破。该模型采用模块化设计,在英语、法语、德语等欧洲语言处理能力上超越同规模模型,其核心创新在于针对移动设备的优化架构,可在...

Read More
2025-05-09 talkingdev

[论文推荐]排行榜幻觉:Chatbot Arena基准测试中的隐藏偏差

最新研究发现,知名聊天机器人竞技平台Chatbot Arena的基准测试存在系统性偏差,主要源于未公开的私有测试和选择性数据访问机制。科技巨头如Google和OpenAI凭借数据特权形成垄断优势,其模型可获得充分调优,而开源...

Read More
2025-05-08 talkingdev

谷歌研究人员利用LLM实现无损文本简化,提升用户理解能力

谷歌研究团队近期通过大语言模型(LLM)技术,成功开发出一种能够简化复杂文本同时保留关键细节的创新方法。这项技术突破不仅显著提升了普通用户对专业内容的理解能力,还确保了原始信息的准确性和细微差别的完整性...

Read More
2025-05-08 talkingdev

Mistral发布企业级AI助手Le Chat,支持本地化部署

法国AI初创公司Mistral近日正式推出企业级对话助手Le Chat Enterprise,该产品最大特点是支持完全本地化部署,为企业数据安全提供保障。作为开源大模型领域的领军者,Mistral此次发布的解决方案允许企业将AI系统部署...

Read More
2025-05-07 talkingdev

[论文推荐]Chain of Draft:高效推理新范式,显著降低计算成本

近日,一项名为Chain of Draft的创新推理策略在arXiv预印本平台引发关注。该技术通过精简推理路径设计,在保持与经典Chain-of-Thought方法相当甚至更高准确率的前提下,显著降低了大型语言模型的token消耗量。实验数...

Read More
2025-05-06 talkingdev

资深LLM用户自述:生成式大模型并非我的常用工具

近日,一位长期使用大语言模型(LLM)的资深用户在个人博客中分享了他的使用心得。尽管生成式LLM(如GPT系列)在业界引起广泛关注,但该作者表示自己并不频繁使用这类模型。相反,他更倾向于将LLM应用于特定场景,如...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page