LLM的相关内容 - 漫话开发者

2025-07-10 talkingdev

Biomni：斯坦福团队开源通用生物医学AI智能体

斯坦福大学SNAP实验室在GitHub开源了Biomni项目，这是一种通用型生物医学AI智能体，通过结合大语言模型（LLM）的推理能力、检索增强规划技术以及代码执行功能，能够自主完成跨生物医学领域的研究任务。该系统突破了...

2025-07-09 talkingdev

Supabase的MCP集成功能被发现存在严重安全漏洞，可能导致敏感SQL数据库信息泄露。该漏洞的攻击方式为：恶意用户通过精心构造的支持工单消息，指示具有高权限（service_role）的LLM（大型语言模型）从敏感表中提取数...

2025-07-09 talkingdev

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型，支持六种语言，具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能，为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

2025-07-08 talkingdev

开源项目Helicone近日发布了一款专为大型语言模型（LLM）设计的可观测性平台，该平台仅需一行代码即可实现对LLM的监控、评估和实验功能。作为Y Combinator W23批次的入选项目，Helicone致力于为开发者和企业提供高效...

2025-07-07 talkingdev

Sakana AI最新发布的TreeQuest技术通过创新的多模型协作框架（Multi-LLM AB-MCTS），实现了比单一大型语言模型（LLM）性能提升30%的突破。该技术采用自适应分支蒙特卡洛树搜索（Adaptive Branching Monte Carlo Tree...

2025-07-04 talkingdev

Anyscale研究团队近期对TRL、Verl、OpenRLHF等九大开源强化学习框架进行了系统性评测，涵盖采用度指标、系统特性和技术架构三大维度。该研究为开发者选择适合RLHF（人类反馈强化学习）、推理模型或智能体训练场景的...

2025-07-02 talkingdev

Spegel是一款概念验证性的终端网页浏览器，其独特之处在于通过大型语言模型（LLM）处理HTML内容，并将其转换为适合终端显示的Markdown格式。这一创新尝试展示了LLM在网页内容处理和转换方面的潜力，为终端用户提供了...

2025-07-01 talkingdev

TauricResearch团队在GitHub上开源了TradingAgents项目，这是一个基于多智能体大语言模型（LLM）的金融交易框架。该框架通过结合多个智能体的协同决策能力，旨在提升金融交易的智能化水平和决策效率。TradingAgents...