漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-22 talkingdev

开源Bloom工具:自动化评估AI模型行为,提升安全性与可解释性

Anthropic近日开源了名为Bloom的工具,这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率,能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...

Read More
2025-12-21 talkingdev

评估报告:Claude Opus 4.5任务处理“半衰期”达4小时49分,性能较前代翻倍

人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...

Read More
2025-12-21 talkingdev

Claude推出Chrome浏览器扩展,AI助手深度集成工作流

人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展,标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力,实现实时问答、网页内...

Read More
2025-12-20 talkingdev

AI芯片独角兽Cerebras重启IPO进程:最快下周递交申请,目标2026年第二季度上市

据路透社援引知情人士消息,专注于人工智能训练领域的芯片制造商Cerebras Systems正计划重启其首次公开募股进程。该公司预计最快将于下周向美国证券交易委员会提交IPO申请,目标是在2026年第二季度完成上市。此举标...

Read More
2025-12-20 talkingdev

AI编程工具Graphite正式并入Cursor,强强联合重塑开发生产力

在AI驱动编程工具竞争日益激烈的背景下,一项重要的行业整合事件引发了开发者社区的广泛关注。专注于代码审查与协作的初创公司Graphite近日正式宣布,将加入由知名AI代码助手Cursor构建的生态系统。Cursor凭借其深度...

Read More
2025-12-20 talkingdev

2025年大语言模型范式变革年度回顾:关键趋势与未来展望

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

Read More
2025-12-19 talkingdev

开源|picknplace.js:为移动端交互带来革新,三步完成拖拽操作

在移动设备交互设计领域,传统的拖拽操作常因屏幕空间有限、手指遮挡和精准定位困难而体验不佳。近日,一个名为picknplace.js的开源JavaScript库提出了一种全新的交互范式,旨在从根本上优化这一用户体验。该库摒弃...

Read More
2025-12-19 talkingdev

Anthropic在Chrome中试点Claude AI,集成Claude Code实现浏览器内代码测试与验证

人工智能公司Anthropic近日宣布,正在Chrome浏览器中试点其AI助手Claude,旨在测试基于浏览器的AI能力,并为更广泛的发布构建必要的安全措施。此次试点的一个关键亮点是Claude与Claude Code的深度集成。Claude Code...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page