漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-06 talkingdev

[开源]Clippy:为本地大语言模型注入90年代经典UI风格

开发者Felix Rieseberg近日推出开源项目Clippy,将90年代经典的Office助手交互界面与现代本地化大语言模型(LLM)技术相结合。该项目在Hacker News引发热议,获得783个点赞和199条评论,反映出开发者社区对创新人机...

Read More
2025-05-06 talkingdev

Claude系统提示词泄露:超2.4万token的AI工具配置曝光

GitHub平台近日出现关于Anthropic公司AI助手Claude的系统提示词(system prompt)完整配置泄露事件。该文件显示Claude的系统提示词规模惊人,总长度超过24,000个token,并包含详细的工具调用配置。系统提示词作为大...

Read More
2025-05-06 talkingdev

LRAGE-法律领域大语言模型评估框架开源

LRAGE(Legal RAG Evaluation Toolkit)是一个开源的评估框架,专门用于在法律领域的检索增强生成(RAG)任务中评估大语言模型(LLM)的性能。该工具包集成了多种数据集和评估工具,为研究人员提供了一个全面的平台...

Read More
2025-05-05 talkingdev

资深LLM用户自述:生成式大模型并非我的常用工具

近日,一位长期使用大语言模型(LLM)的资深用户在个人博客中分享了他的使用心得。尽管生成式LLM(如GPT系列)在业界引起广泛关注,但该作者表示自己并不频繁使用这类模型。相反,他更倾向于将LLM应用于特定场景,如...

Read More
2025-05-05 talkingdev

阿里巴巴发布Qwen 3系列AI模型,号称可媲美谷歌与OpenAI顶级模型

阿里巴巴近日正式推出Qwen 3系列人工智能模型,该系列模型采用混合专家架构(Mixture of Experts),具备先进的推理能力,并宣称其性能可媲美谷歌和OpenAI的顶级模型。Qwen 3系列模型支持119种语言,训练数据规模高...

Read More
2025-05-05 talkingdev

[开源]WebThinker:赋能大语言模型的深度研究框架

中国人民大学自然语言处理实验室推出的WebThinker框架,标志着大语言模型(LRMs)向自主科研领域迈出关键一步。该开源项目通过构建深度研究架构,使LRMs具备三项突破性能力:1)智能化的全网信息检索系统,可自主定...

Read More
2025-05-04 talkingdev

现代LLM采样技术入门指南:从原理到实践

一篇题为《Dummy's Guide to Modern LLM Sampling》的技术指南近期在开发者社区引发热议,该文章系统性地解读了现代大语言模型(LLM)中的采样技术。作为自然语言生成的核心组件,采样策略直接决定了文本输出的质量和...

Read More
2025-05-03 talkingdev

Anemll开源-在苹果神经引擎上运行大语言模型

GitHub最新开源项目Anemll(Artificial Neural Engine Machine Learning Library)引发开发者社区广泛关注,该项目实现了在苹果设备神经引擎(ANE)上高效运行大语言模型(LLMs)的技术突破。作为专为ANE优化的机器学习...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page