语言模型的相关内容 - 漫话开发者

2025-08-02 talkingdev

深度智能体：突破LLM工具调用局限，实现复杂任务规划与执行

近日，LangChain博客发布了一篇关于深度智能体（Deep Agents）的技术文章，探讨了如何克服当前基于大语言模型（LLM）的智能体在复杂任务规划与执行中的局限性。传统LLM智能体通常采用简单的工具调用循环架构，这种“...

2025-08-01 talkingdev

MCP-Use是一款开源的Python库，旨在将大型语言模型（LLM）与MCP服务器连接起来，以便构建具有工具访问权限的自定义代理。该库通过LangChain支持多种LLM，使代理能够利用诸如网页浏览、文件操作等工具，并使用标准I/O...

2025-08-01 talkingdev

近期，佛教学者对ChatGPT o3生成的一篇AI“佛经”进行了专业分析，发现其通过悖论解构等手法，呈现出复杂的哲学概念与意象，成功唤起了佛教核心教义如“空性”的思考。研究表明，尽管大语言模型（LLMs）能够复述佛法教义...

2025-08-01 talkingdev

亚马逊正通过实用型生成式AI创新深刻改变人类工作与生活方式。作为拥有25年AI/ML模型部署经验的技术先驱，亚马逊已构建超1,000个生成式AI应用矩阵，覆盖从AWS云服务、Alexa智能语音到物流机器人等全业务场景。其AI人...

2025-07-31 talkingdev

GitHub开源项目Crush由charmbracelet团队推出，定位为终端环境下的AI编程助手，其核心价值在于无缝整合开发者现有工具链与大型语言模型（LLM）。该工具突破性地实现了三大功能：1) 支持多模型动态切换，满足不同场景...

2025-07-31 talkingdev

近日，Ollama正式推出了全新的macOS和Windows应用程序，旨在为用户提供更加便捷的语言模型交互体验。该应用不仅支持用户轻松下载和与多种语言模型进行对话，还引入了创新的文件拖放功能，允许用户直接上传文件进行分...

2025-07-30 talkingdev

开发者近期展示了一种名为'nano-claude-code'的极简代码代理工具，仅需200行JavaScript代码（基于Bun运行时）即可实现类似Claude Code的核心功能。该技术突破展示了大型语言模型与本地文件系统交互的新范式：通过读...

2025-07-30 talkingdev

人工智能初创公司Lumana AI Inc.近日宣布完成4000万美元的A轮融资，本轮融资由Wing Venture Capital领投。该公司致力于通过人工智能技术革新视频监控领域，其核心创新在于将先进的视觉语言模型（Vision-Language Mod...