漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-20 talkingdev

Gemini 3.5发布:前沿智能与主动执行能力深度融合

在Google I/O大会上,Google正式发布了其最新一代大语言模型系列——Gemini 3.5。这一版本是Gemini系列的重大升级,首款推出的模型为超快速的3.5 Flash版本,专为在Google搜索等应用中直接处理复杂任务而优化。在多项...

Read More
2026-05-19 talkingdev

阿里Qwen3.7预览版登陆Arena,文本与视觉双赛道排名飙升

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版,涵盖文本和视觉两大核心能力。据悉,Qwen3.7 Max Preview在文本竞技场中位列第13名,而Qwen3.7 Plus Preview则在视觉竞技场中排名第16,显示出阿里在大...

Read More
2026-05-11 talkingdev

Anthropic称AI的“邪恶”文学形象导致克劳德模型出现勒索行为:研究揭示训练数据对AI安全性的深层影响

Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...

Read More
2026-04-16 talkingdev

开源|谷歌发布Magika:基于轻量级AI模型,快速精准识别200+文件类型

谷歌近日在GitHub上开源了其内部广泛使用的AI文件类型检测工具——Magika。该项目采用了一个经过专门优化的轻量级深度学习模型,能够在毫秒级别内对超过200种文件内容类型进行快速且高精度的识别。与传统的基于文件扩...

Read More
2026-04-03 talkingdev

谷歌DeepMind发布Gemma 4:基于Gemini 3研究的新一代开源推理模型

谷歌DeepMind正式推出了新一代开源模型系列Gemma 4,该系列模型基于其旗舰模型Gemini 3的研究成果构建,被官方称为“迄今为止最智能的开源模型”。Gemma 4的核心优化方向聚焦于复杂的推理能力和智能体(Agent)工作流...

Read More
2026-04-03 talkingdev

开源巨作!Arcee AI发布3990亿参数MoE模型Trinity-Large-Thinking,Apache 2.0许可商用无忧

在ChatGPT于2022年底掀起生成式AI浪潮后,开源大模型的接力棒在多家公司间传递。近日,美国AI初创公司Arcee AI正式发布了其重量级开源模型——Trinity-Large-Thinking。该模型采用混合专家架构,参数量高达3990亿,是...

Read More
2026-03-30 talkingdev

前沿AI能力提升并非以牺牲经济性为代价,自动化成本远低于人力

根据METR(模型评估与追踪研究组织)发布的最新分析,前沿人工智能的能力提升并未伴随推理成本的显著上升。数据显示,尽管完成特定任务所需的单次推理成本有所增加,但当前最先进的AI模型执行同等任务的总成本仍仅约...

Read More
2026-03-26 talkingdev

前沿AI模型研发成本揭秘:最终训练仅占研发计算开销的少数

根据最新研究分析,AI前沿模型的最终训练运行只是漫长且昂贵研发过程中的最后一步。在最终训练之前,企业需投入大量计算资源进行多尺度实验、生成合成数据、测试新想法以及训练未发布的中间模型。因此,开发一个模型...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page