漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理:无关信息触发推理模型错误率激增300%

最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...

Read More
2025-07-10 talkingdev

Biomni:斯坦福团队开源通用生物医学AI智能体

斯坦福大学SNAP实验室在GitHub开源了Biomni项目,这是一种通用型生物医学AI智能体,通过结合大语言模型(LLM)的推理能力、检索增强规划技术以及代码执行功能,能够自主完成跨生物医学领域的研究任务。该系统突破了...

Read More
2025-07-09 talkingdev

Supabase MCP漏洞可能导致整个SQL数据库泄露

Supabase的MCP集成功能被发现存在严重安全漏洞,可能导致敏感SQL数据库信息泄露。该漏洞的攻击方式为:恶意用户通过精心构造的支持工单消息,指示具有高权限(service_role)的LLM(大型语言模型)从敏感表中提取数...

Read More
2025-07-09 talkingdev

Hugging Face发布SmolLM3:小型多语言长上下文推理模型

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型,支持六种语言,具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能,为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

Read More
2025-07-09 talkingdev

AI2发布全开源语言模型OLMo 2系列,32B版本超越GPT-3.5 Turbo

艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...

Read More
2025-07-09 talkingdev

NotebookLLaMa:基于LlamaCloud的开源替代方案

NotebookLLaMa是一个完全开源的项目,旨在提供NotebookLM的替代方案。该项目利用LlamaCloud进行文档处理,结合OpenAI的内容生成能力和ElevenLabs的语音合成技术,构建了一个功能强大的知识管理平台。作为开源社区的...

Read More
2025-07-08 talkingdev

[开源]Helicone推出开源LLM可观测性平台:一行代码实现监控、评估与实验

开源项目Helicone近日发布了一款专为大型语言模型(LLM)设计的可观测性平台,该平台仅需一行代码即可实现对LLM的监控、评估和实验功能。作为Y Combinator W23批次的入选项目,Helicone致力于为开发者和企业提供高效...

Read More
2025-07-08 talkingdev

[论文推荐] Mercury:基于扩散模型的超高速语言模型

近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page