漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-14 talkingdev

MEAP技术开源:通过掩码增强自回归预测提升推理能力

近日,一项名为Mask-Enhanced Autoregressive Prediction(MEAP)的技术在GitHub上发布,该技术通过将Masked Language Modeling(MLM)整合到仅解码器的Transformer中,显著提升了信息检索任务的性能,同时保持了强...

Read More
2025-02-13 talkingdev

微软推出Data Formulator:基于语言模型的数据可视化工具

微软近日在GitHub上发布了一款名为Data Formulator的工具,该工具利用语言模型(LLM)帮助用户快速生成图表并回答与数据集相关的问题。Data Formulator通过API密钥与云端模型连接,能够高效处理数据分析和可视化任务...

Read More
2025-02-13 talkingdev

DeepScaleR:通过扩展RL训练,1.5B模型超越O1-Preview

近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...

Read More
2025-02-13 talkingdev

PgAssistant:开源工具助力开发者优化PostgreSQL性能

近日,一款名为PgAssistant的开源工具正式发布,旨在帮助开发者更好地理解和优化PostgreSQL(PG)数据库的性能。PgAssistant通过提供详细的性能分析报告和优化建议,使开发者能够快速定位数据库中的性能瓶颈,并采取...

Read More
2025-02-11 talkingdev

Copyover MUD服务器的工作原理解析

Copyover MUD服务器是一种用于多用户虚拟环境(MUD)的技术解决方案,旨在优化服务器重启时的用户体验。传统MUD服务器在重启时需要断开所有用户的连接,导致玩家体验中断。而Copyover技术通过在服务器重启时将当前会...

Read More
2025-01-31 talkingdev

Stats:macOS系统监控工具,菜单栏中的性能助手

Stats是一款专为macOS设计的系统监控工具,能够直接在菜单栏中实时显示系统性能数据。用户无需打开复杂的系统监控应用,即可轻松查看CPU、内存、磁盘、网络等关键指标。Stats支持高度自定义,用户可以根据需求选择显...

Read More
2025-01-29 talkingdev

本地部署DeepSeek-R1模型的完整硬件+软件配置解析

本文详细介绍了一种价值6000美元的硬件配置方案,用于在本地环境中运行完整的DeepSeek-R1模型。该配置方案需要两台CPU和768GB的RAM,跨越24个RAM通道。虽然方案中并未包含GPU,但可以额外添加GPU以提高模型生成速度...

Read More
2025-01-24 talkingdev

Virtuoso Small性能超越Phi 4,实际应用表现更优

近日,Virtuoso Small在性能测试中表现优异,成功超越新发布的Phi 4模型。尽管两者在权重数量上相同,但Virtuoso Small在基准测试中得分更高,尤其是在实际任务中表现更为出色。Phi模型依赖的合成数据在某些场景下可...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page