漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-18 talkingdev

[论文推荐]Funsearch:LLM驱动的遗传算法助力数学家解决组合与数论问题

Funsearch是一种基于大型语言模型(LLM)驱动的遗传算法新实现,旨在帮助数学家解决组合和数论问题,而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力,为数学研究提供了全新...

Read More
2025-03-13 talkingdev

OpenR1 新版本更新:小型模型在竞争性编程中表现优异

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现:当针对竞争性编程进行专门调优时,小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

Read More
2025-03-11 talkingdev

利用强化学习教授语言模型解决数独问题

这项研究探索了如何通过强化学习来教授AI语言模型解决数独谜题,特别采用了Group Relative Policy Optimization (GRPO)技术,应用于Qwen 2.5等模型,无需依赖外部数据或更大模型的蒸馏。研究设计了一个多方面的奖励...

Read More
2025-03-11 talkingdev

AI语言模型通过强化学习掌握数独解题能力

最新研究展示了如何通过强化学习技术,使AI语言模型具备解决数独谜题的能力。该研究采用了Group Relative Policy Optimization (GRPO)方法,并在Qwen 2.5等模型上进行了实验,无需依赖外部数据或更大模型的蒸馏。研...

Read More
2025-01-17 talkingdev

百种编程语言挑战解决Project Euler前100题

近日,有编程爱好者发起了一个挑战性的项目,使用100种不同的编程语言来解决Project Euler的前100道问题。这个项目不仅展示了编程语言的多样性,而且也向人们展示了不同编程语言解决复杂数学问题的能力。Project Eul...

Read More
2025-01-14 talkingdev

高效调试指南:掌握规则以发现最隐蔽的问题

调试是软件开发中不可或缺的一部分,它帮助开发者识别并修复代码中的错误。2004年发布的《Debugging: Indispensable rules for finding even the most elusive problems》中详细介绍了一套调试规则,这些规则能够帮...

Read More
2024-12-14 talkingdev

软件工程师的首次机器人制作之旅

对于软件工程师而言,制作机器人是一个将软件技能应用于实体硬件的挑战。这不仅涉及编写代码和编程,还包括理解机械工程、电子学以及如何将这些元素与软件无缝集成。在制作机器人的过程中,软件工程师需要掌握机器人...

Read More
2024-12-02 talkingdev

论文:预训练中的程序性知识提升LLM的推理能力

最新研究显示,大型语言模型(LLM)的推理能力得益于预训练阶段发展出的程序性知识。程序性知识指的是一系列规则和步骤,这些知识在预训练过程中被模型学习并内化,进而在后续任务中被用来指导推理。这一发现强调了...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page