语言模型的相关内容 - 漫话开发者

2026-07-20 talkingdev

阿里巴巴宣布2.4万亿参数模型Qwen3.8即将开源，预览版已上线

阿里巴巴通义千问团队正式公布Qwen3.8，这是一款参数规模高达2.4万亿的超大规模语言模型，并明确表示将以开放权重（Open-Weight）的方式面向全球发布。这不仅是Qwen系列模型参数的又一次飞跃，也反映出阿里巴巴在开...

2026-07-17 talkingdev

微软首席执行官萨提亚·纳德拉在7月16日的内部员工会议上，罕见地公开批评竞争对手Anthropic旗下最新语言模型Claude Fable 5的请求策略，直指其过度“编辑控制”并限制用户提交的某些请求，这种做法“毫无道理”。事件背...

2026-07-16 talkingdev

近期在GitHub上开源的Boop Agent项目，为iMessage用户提供了一种全新的个人人工智能交互范式。该项目并非简单的聊天机器人，而是一个深度集成在苹果iMessage中的个人智能体应用。其技术核心在于提供了双运行时选择：...

2026-07-15 talkingdev

据TechCrunch报道，国内大语言模型开发商DeepSeek正在与投资者洽谈约15亿美元的新一轮融资，投前估值已高达710亿美元。与此同时，该公司被曝正为2027年首次公开募股（IPO）做准备。这一动作标志着DeepSeek在经历模型...

2026-07-15 talkingdev

纽约金融科技初创公司Hadrius宣布完成2200万美元的A轮融资，由知名风投CRV领投，Y Combinator等机构跟投。Hadrius专注于为金融服务机构打造AI原生合规工具，利用大语言模型和自动化技术，将繁琐的监管合规流程从人工...

2026-07-15 talkingdev

据The Information援引知情人士消息，中国开源AI明星企业DeepSeek的年度经常性收入近期已达到4亿至5亿美元区间，展现出强劲的商业化增长势头。在这一业绩支撑下，公司正积极推进第二轮融资，计划筹集约74亿美元资金...

2026-07-14 talkingdev

一篇技术博文揭示了优化专用AI智能体工作流的惊人成果：通过将自然语言指令模型转换为编译后的代码版本，成功将Token使用量降低了94%，同时延迟减少了87%。该优化策略的核心在于，先利用自然语言模型探索并锁定稳定...

2026-07-14 talkingdev

在大型语言模型（LLM）驱动的AI智能体日益普及的今天，如何可靠地评估其在长时间、多步骤任务中的实际生产力，仍是行业面临的核心挑战。GitHub上最新发布的开源项目LHTB（Long-Horizon Terminal Benchmark）正试图填...