漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-28 talkingdev

Qwen团队推出1M上下文模型,性能强劲且本地化

Qwen团队近日发布了其最新的1M上下文模型,展示了在训练过程中逐步扩展上下文能力的技术进展。该模型不仅性能强劲,还支持本地化运行,显著提升了处理长文本任务的效率。此外,Qwen团队还发布了基于vLLM的推理框架,...

Read More
2025-01-28 talkingdev

开发者推出ErisForge:专为LLM消融设计的Python库

近日,一款名为ErisForge的Python库在技术社区中引起了广泛关注。该库由一位开发者独立创建,旨在为大型语言模型(LLM)的消融研究提供支持。ErisForge通过简化消融实验的流程,帮助研究人员更高效地分析和理解LLM的...

Read More
2025-01-28 talkingdev

DeepSeek发布Janus Pro:全新文本生成图像工具

近日,DeepSeek正式发布了其最新的文本生成图像工具Janus Pro。该工具基于先进的LLM技术,结合embedding和LoRA优化,能够将用户输入的文本描述快速转化为高质量的图像。Janus Pro不仅支持多种艺术风格,还通过RAG技...

Read More
2025-01-26 talkingdev

论文DeepSeek-R1-通过强化学习提升LLM的推理能力

近日,DeepSeek团队发布了其最新研究成果DeepSeek-R1,旨在通过强化学习(RL)技术提升大型语言模型(LLM)的推理能力。DeepSeek-R1的核心目标是通过激励机制优化模型的推理过程,使其在处理复杂问题时表现出更高的...

Read More
2025-01-25 talkingdev

2025年智能家居新趋势:Home Assistant的深度应用

随着智能家居技术的飞速发展,Home Assistant在2025年已成为家庭自动化的核心工具。通过集成多种智能设备,Home Assistant不仅能够实现设备的互联互通,还能通过LLM和agent技术提供更加智能化的服务。用户可以通过简...

Read More
2025-01-25 talkingdev

Subpixel Snake视频展示:AI驱动的像素级游戏创新

近日,一段名为Subpixel Snake的视频在技术社区引发了广泛关注。该视频展示了一种基于AI技术的像素级游戏创新,通过LLM和agent的结合,实现了前所未有的游戏体验。视频中,玩家可以操控一条由subpixel组成的蛇,在复...

Read More
2025-01-24 talkingdev

Virtuoso Small性能超越Phi 4,实际应用表现更优

近日,Virtuoso Small在性能测试中表现优异,成功超越新发布的Phi 4模型。尽管两者在权重数量上相同,但Virtuoso Small在基准测试中得分更高,尤其是在实际任务中表现更为出色。Phi模型依赖的合成数据在某些场景下可...

Read More
2025-01-24 talkingdev

开源推荐:评估蒸馏LLM的双重量化指标

近日,GitHub上发布了一个专注于评估蒸馏LLM(Large Language Models)性能的开源项目。该项目提供了两种互补的量化指标,旨在帮助研究人员和开发者更精确地衡量LLM蒸馏的效果。蒸馏技术是一种通过将大型模型的知识...

Read More
  1. Prev Page
  2. 35
  3. 36
  4. 37
  5. Next Page