漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-12 talkingdev

Reka发布全新推理模型Flash 3,性能媲美专有模型

Reka公司近日开源了其最新推出的Reka Flash 3模型,这是一款拥有210亿参数的多功能模型,专门针对推理、聊天、编码和指令遵循等任务进行了优化。该模型在性能上与专有模型不相上下,并配备了32k的上下文长度,使其非...

Read More
2025-02-17 talkingdev

CodeI/O:通过代码输入输出预测提升大语言模型推理能力

近日,CodeI/O技术通过将代码转换为输入输出预测格式,显著提升了大语言模型(LLM)的推理能力。该方法通过教授通用推理原则,而非依赖代码语法,从而在多种推理任务中实现了性能优化。此外,通过多轮修订进一步验证...

Read More