漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-14 talkingdev

MEAP技术开源:通过掩码增强自回归预测提升推理能力

近日,一项名为Mask-Enhanced Autoregressive Prediction(MEAP)的技术在GitHub上发布,该技术通过将Masked Language Modeling(MLM)整合到仅解码器的Transformer中,显著提升了信息检索任务的性能,同时保持了强...

Read More
2025-02-13 talkingdev

DeepScaleR:通过扩展RL训练,1.5B模型超越O1-Preview

近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...

Read More
2025-02-12 talkingdev

DeepMind提出新观点:Agency的测量需依赖参考框架

近日,DeepMind发布了一篇立场论文,探讨了如何衡量系统的“Agency”属性。论文指出,Agency的测量并非一个全局属性,而是依赖于特定的参考框架。这意味着,判断一个系统是否具有Agency,需要明确其所在的上下文和参考...

Read More
2025-02-10 talkingdev

Pika Labs推出Pikadditions:AI视频编辑工具实现无缝对象与角色嵌入

Pika Labs近日发布了其最新视频编辑工具Pikadditions,这是一款基于AI的视频到视频处理工具,能够无缝地将对象和角色嵌入到现有视频中,同时保持高度的真实感。该工具利用先进的embedding技术和LoRA模型,确保添加的...

Read More
2025-02-07 talkingdev

深入解析推理型LLMs:技术原理与应用前景

随着人工智能技术的快速发展,推理型LLMs(Large Language Models)在自然语言处理领域展现出了巨大的潜力。推理型LLMs不仅能够生成高质量的文本,还具备强大的逻辑推理能力,能够在复杂任务中提供精准的解决方案。...

Read More
2025-02-06 talkingdev

谷歌发布全新AI模型Gemini 2.0,推动AI思考能力发展

谷歌本周三推出了Gemini 2.0 Pro Experimental实验版,并在其推理模型Gemini 2.0 Flash Thinking上进行了更新,用户可以在Gemini应用中使用。Gemini 2.0 Pro Experimental将在谷歌的AI开发平台Vertex AI和Google AI...

Read More
2025-01-30 talkingdev

Augment Code:让AI助手真正理解你的代码库

厌倦了那些只会生成通用代码的AI编程助手吗?Augment Code与众不同:它是目前最具上下文感知能力的开发者AI。Augment能够深度理解你的团队如何构建软件,实时学习你的整个代码库、文档和依赖项。即使面对超过1000万...

Read More
2025-01-30 talkingdev

深度解析DeepSeek的R1-Zero与R1技术架构

近日,DeepSeek公司发布了其最新的R1-Zero和R1技术架构,引发了业界的广泛关注。R1-Zero作为一款轻量级模型,专注于低资源环境下的高效运行,特别适用于边缘计算和物联网设备。其采用了先进的LoRA技术,能够在保持高...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page