语言模型的相关内容 - 漫话开发者

2025-08-04 talkingdev

Anthropic研究：人格向量技术实现语言模型性格特征的监测与控制

Anthropic研究人员通过对比神经网络在展现特定性格特征与未展现时的活动差异，成功提取出"人格向量"，揭示了语言模型性格变化遵循可预测的数学规律。这一突破性发现促成了一种反直觉的"疫苗接种"式训练方法——在训练...

2025-08-02 talkingdev

近日，LangChain博客发布了一篇关于深度智能体（Deep Agents）的技术文章，探讨了如何克服当前基于大语言模型（LLM）的智能体在复杂任务规划与执行中的局限性。传统LLM智能体通常采用简单的工具调用循环架构，这种“...

2025-08-01 talkingdev

MCP-Use是一款开源的Python库，旨在将大型语言模型（LLM）与MCP服务器连接起来，以便构建具有工具访问权限的自定义代理。该库通过LangChain支持多种LLM，使代理能够利用诸如网页浏览、文件操作等工具，并使用标准I/O...

2025-08-01 talkingdev

近期，佛教学者对ChatGPT o3生成的一篇AI“佛经”进行了专业分析，发现其通过悖论解构等手法，呈现出复杂的哲学概念与意象，成功唤起了佛教核心教义如“空性”的思考。研究表明，尽管大语言模型（LLMs）能够复述佛法教义...

2025-08-01 talkingdev

亚马逊正通过实用型生成式AI创新深刻改变人类工作与生活方式。作为拥有25年AI/ML模型部署经验的技术先驱，亚马逊已构建超1,000个生成式AI应用矩阵，覆盖从AWS云服务、Alexa智能语音到物流机器人等全业务场景。其AI人...

2025-07-31 talkingdev

GitHub开源项目Crush由charmbracelet团队推出，定位为终端环境下的AI编程助手，其核心价值在于无缝整合开发者现有工具链与大型语言模型（LLM）。该工具突破性地实现了三大功能：1) 支持多模型动态切换，满足不同场景...

2025-07-31 talkingdev

近日，Ollama正式推出了全新的macOS和Windows应用程序，旨在为用户提供更加便捷的语言模型交互体验。该应用不仅支持用户轻松下载和与多种语言模型进行对话，还引入了创新的文件拖放功能，允许用户直接上传文件进行分...

2025-07-30 talkingdev

开发者近期展示了一种名为'nano-claude-code'的极简代码代理工具，仅需200行JavaScript代码（基于Bun运行时）即可实现类似Claude Code的核心功能。该技术突破展示了大型语言模型与本地文件系统交互的新范式：通过读...