TeX的相关内容 - 漫话开发者

2025-02-13 talkingdev

DeepScaleR：通过扩展RL训练，1.5B模型超越O1-Preview

近期，DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习（RL）训练，成功开发出一款1.5B参数的模型，其性能超越了O1-Preview。研究团队采用了一种独特的方法，即在RL训练过程中逐步增加上下文长度，从而...

2025-02-12 talkingdev

DeepMind提出新观点：Agency的测量需依赖参考框架

近日，DeepMind发布了一篇立场论文，探讨了如何衡量系统的“Agency”属性。论文指出，Agency的测量并非一个全局属性，而是依赖于特定的参考框架。这意味着，判断一个系统是否具有Agency，需要明确其所在的上下文和参考...

2025-02-06 talkingdev

谷歌发布全新AI模型Gemini 2.0，推动AI思考能力发展

谷歌本周三推出了Gemini 2.0 Pro Experimental实验版，并在其推理模型Gemini 2.0 Flash Thinking上进行了更新，用户可以在Gemini应用中使用。Gemini 2.0 Pro Experimental将在谷歌的AI开发平台Vertex AI和Google AI...

2025-01-28 talkingdev

1Prompt1Story：无需训练的文本到图像生成新方法

1Prompt1Story是一种无需训练的文本到图像生成方法，通过单一串联提示实现一致的图像生成。该方法的核心在于将多个提示信息串联成一个整体，从而在生成过程中保持一致性。与传统的训练依赖型方法不同，1Prompt1Story...

2025-01-28 talkingdev

DeepSeek发布Janus Pro：全新文本生成图像工具

近日，DeepSeek正式发布了其最新的文本生成图像工具Janus Pro。该工具基于先进的LLM技术，结合embedding和LoRA优化，能够将用户输入的文本描述快速转化为高质量的图像。Janus Pro不仅支持多种艺术风格，还通过RAG技...

2025-01-24 talkingdev

LOKI：多模态检测模型的合成基准测试

LOKI 是一个用于评估视觉语言模型（VLMs）在检测新颖和具有挑战性项目方面表现的合成基准测试工具。该基准测试通过生成复杂的多模态数据，帮助研究人员更好地理解模型在处理未知或复杂场景时的能力。LOKI 的设计旨在...

2025-01-24 talkingdev

Luma AI发布Ray2：新一代大规模视频生成模型

Luma AI近日发布了其最新的大规模视频生成模型Ray2，该模型在真实视觉效果、自然连贯的运动以及逻辑事件序列方面设定了新的标准。Ray2基于Luma全新的多模态架构进行训练，计算能力较前代Ray1提升了10倍。目前，Ray2...

2025-01-24 talkingdev

Llama.vim推出本地LLM辅助文本补全功能

Llama.vim近日宣布推出本地LLM辅助文本补全功能，这一创新技术将为开发者提供更高效的代码编写体验。通过集成本地LLM模型，Llama.vim能够在离线环境下实现智能文本补全，显著提升开发效率。该功能不仅支持多种编程语...