漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-02 talkingdev

RAG智能体可观测性技术深度解析

本文系统介绍了如何结合检索增强生成(RAG)技术与大语言模型运维(LLMOps)构建高仿真智能体的技术路径。作为当前AI领域的前沿方向,该方案通过实时监控智能体的决策过程、知识检索准确性和生成质量等关键指标,显...

Read More
2025-05-02 talkingdev

微软推出Phi-4-reasoning变体,推动小型语言模型在效率与推理能力上的突破

微软近日发布了Phi-4-reasoning系列变体,这一创新标志着小型语言模型(SLMs)在效率与复杂推理能力上的重大进展。Phi-4-reasoning通过算法优化和架构改进,在保持参数规模精简的同时,实现了接近大型语言模型(LLMs...

Read More
2025-04-25 talkingdev

MiniPLM框架发布:利用大模型知识提升小语言模型预训练效率

近日,自然语言处理领域迎来一项重要技术突破——MiniPLM框架正式发布。该框架创新性地提出了一种高效的小型语言模型(SLM)预训练方法,通过从大型语言模型(LLM)中提取知识进行蒸馏训练,显著提升了小模型的性能表...

Read More
2025-04-18 talkingdev

Goodfire完成5000万美元A轮融资,专注AI模型可解释性与行为控制研究

AI可解释性领域领军企业Goodfire近日宣布完成5000万美元A轮融资。该公司在稀疏自编码器(SAEs)等机械可解释性技术上具有深厚积累,致力于通过与闭源及开源模型提供方的深度合作,系统性地解析、引导和控制AI模型的...

Read More
2025-04-17 talkingdev

[开源]Prima CPP:低内存环境下运行大模型的创新方案

Prima CPP是llama.cpp的一个扩展项目,旨在通过内存映射(mmaping)技术,使大型模型能够在低内存环境中高效运行。这一技术突破为资源受限的设备部署先进AI模型提供了可能,尤其适用于边缘计算和移动端场景。通过优...

Read More
2025-03-28 talkingdev

本地运行DeepSeek RAG:结合Elasticsearch、Ollama和Kibana的完整指南

近日,Elastic官方博客发布了一篇关于如何在本地环境中运行RAG(检索增强生成)系统的详细教程。该教程指导用户逐步安装Ollama并在容器中运行,随后将其连接到Kibana可视化平台,最终实现基于DeepSeek R1模型的本地R...

Read More
2025-02-27 talkingdev

本地模型与云端模型协同工作,成本降低83%

Hazy Research的最新研究表明,通过Ollama使用本地模型,并结合长上下文云端模型作为协调器,可以在仅花费17%成本的情况下,实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...

Read More
2024-07-17 talkingdev

GraySwanAI:创新AI安全防护技术引领者

GraySwan灰鹅AI,一家专注于AI安全和防护的公司,专业构建工具帮助各大公司评估他们的AI系统的风险,以及保护他们的AI部署免受有害使用。在AI安全领域,灰鹅AI以其专业和创新的技术手段,为众多企业提供了有效的防护...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page