漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-05-05 talkingdev

现代LLM采样技术入门指南:从原理到实践

一篇题为《Dummy's Guide to Modern LLM Sampling》的技术指南近期在开发者社区引发热议,该文章系统性地解读了现代大语言模型(LLM)中的采样技术。作为自然语言生成的核心组件,采样策略直接决定了文本输出的质量和...

Read More
2025-05-04 talkingdev

Anemll开源-在苹果神经引擎上运行大语言模型

GitHub最新开源项目Anemll(Artificial Neural Engine Machine Learning Library)引发开发者社区广泛关注,该项目实现了在苹果设备神经引擎(ANE)上高效运行大语言模型(LLMs)的技术突破。作为专为ANE优化的机器学习...

Read More
2025-05-03 talkingdev

[开源] BLAST:斯坦福大学发布高性能浏览器-LLM自动扩展服务引擎

斯坦福大学MAST实验室推出的BLAST项目,是一款专为浏览器增强型大语言模型(LLM)设计的高性能服务引擎。该技术旨在简化网页浏览AI代理的部署流程,显著提升响应速度并优化成本管理。其核心创新包括:1)自动并行化...

Read More
2025-05-02 talkingdev

RAG智能体可观测性技术深度解析

本文系统介绍了如何结合检索增强生成(RAG)技术与大语言模型运维(LLMOps)构建高仿真智能体的技术路径。作为当前AI领域的前沿方向,该方案通过实时监控智能体的决策过程、知识检索准确性和生成质量等关键指标,显...

Read More
2025-05-01 talkingdev

[论文推荐]研究人员发现通过表征控制向量可调节大语言模型推理能力

最新研究表明,通过在大语言模型(LLM)的残差流中实施简单的表征控制向量干预,可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联,为可解释AI领域提供了新工具。...

Read More
2025-04-30 talkingdev

AI对冲基金项目开源:基于角色提示的资产预测范式

近期GitHub上出现了一个名为AI Hedge Fund的开源项目,该项目通过现代推理模型探索自动化交易的新路径。与同类尝试相比,其创新性在于采用了基于角色提示(persona based prompting)的技术框架,能够聚合对各类基础资...

Read More
2025-04-30 talkingdev

IBM开源Bamba模型:融合Transformer与SSM优势的新型大语言模型

IBM研究院近日推出开源大语言模型Bamba,该模型创新性地结合了Transformer架构的序列建模能力和状态空间模型(SSM)的推理速度优势。作为IBM Granite系列模型的技术前导,Bamba通过注意力机制与状态空间方程的混合设...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page