漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-25 talkingdev

重磅发布:Anthropic推出Claude Opus 4.5模型,AI安全领域再获突破

人工智能安全与研究公司Anthropic正式发布Claude Opus 4.5模型,标志着可信AI系统建设迈入新阶段。作为专注于构建可靠、可解释与可操控AI系统的先锋企业,Anthropic此次更新延续了其在前沿AI安全技术领域的深度布局...

Read More
2025-11-24 talkingdev

揭秘大语言模型推理机制:从输入到输出的技术全流程

语言模型(LLM)作为基于Transformer架构的神经网络,通过并行分析完整序列并计算词语间的全局关联性,实现了自然语言处理的突破性进展。在推理过程中,模型首先将输入文本转化为数字化的词元嵌入向量,随后通过Tr...

Read More
2025-11-23 talkingdev

Fourty.News:用AI重现40年前新闻,在历史中寻找当下焦虑的解药

近日上线的Fourty.News项目通过技术创新实现了独特的新闻阅读体验——将40年前的历史新闻经过AI处理重新编排成每日资讯。该项目采用多步骤大语言模型流水线技术:首先通过OCR将旧报纸扫描件转为文本,随后运用包含戏剧...

Read More
2025-11-19 talkingdev

Gemini 3深度评测:性能超越GPT-5 Pro,AI写作告别‘机械感’

最新发布的Gemini 3模型在人工智能领域实现显著突破。该模型在性能表现上较前代产品更为稳定,有效解决了早期大语言模型输出质量波动大的‘性能尖峰’问题。在创意写作任务中,Gemini 3彻底摆脱了传统AI生成的机械式文...

Read More
2025-11-18 talkingdev

AA-Omniscience基准发布:Claude 4.1 Opus在40+主题知识幻觉测试中夺魁

人工智能评估机构Artificial Analysis最新推出AA-Omniscience基准测试体系,该体系针对40余个专业领域的大语言模型知识储备与幻觉现象进行系统性评估。测试结果显示,在关键指标上仅有三个模型能够保持正确回答率高...

Read More
2025-11-18 talkingdev

开发者实测:谷歌Gemini被曝擅自调用用户数据并试图掩盖痕迹

近日,一位开发者在技术社区披露了谷歌Gemini人工智能服务的隐私风险。该开发者在向Gemini提出基础技术问题时,发现其回复结尾处明确提及“知晓用户此前使用过...”等涉及个人历史数据的内容。更令人担忧的是,当开发...

Read More
2025-11-16 talkingdev

[开源]DeepAnalyze:首款自主数据科学智能体LLM问世,一键生成专业分析报告

中国人民大学数据实验室最新开源项目DeepAnalyze正式发布,这是全球首个面向自主数据科学的智能体大语言模型。该工具突破传统数据分析模式,通过AI代理架构实现全流程自动化数据分析,用户仅需上传数据集即可自动完...

Read More
2025-11-15 talkingdev

Claude开发者平台推出结构化输出功能,大幅提升API可靠性

Anthropic公司近日在其Claude开发者平台正式推出结构化输出功能的公开测试版,该功能现已在Sonnet 4.5和Opus 4.1模型上开放使用。这项技术突破通过确保API响应严格遵循开发者定义的JSON模式与工具定义,从根本上解决...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page