漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-17 talkingdev

CodeI/O:通过代码输入输出预测提升大语言模型推理能力

近日,CodeI/O技术通过将代码转换为输入输出预测格式,显著提升了大语言模型(LLM)的推理能力。该方法通过教授通用推理原则,而非依赖代码语法,从而在多种推理任务中实现了性能优化。此外,通过多轮修订进一步验证...

Read More
2025-02-16 talkingdev

科技视角下的时间管理:My Life in Weeks

在当今快节奏的科技行业中,时间管理成为了每个专业人士必须掌握的技能。'My Life in Weeks' 是一种创新的时间管理工具,它通过将人的一生分解为周来帮助用户更直观地理解时间的宝贵。这种方法不仅适用于个人生活规...

Read More
2025-02-15 talkingdev

TeX与Typst:2024年排版模型的新进展

在2024年,TeX和Typst作为两种重要的排版模型,继续在技术领域展现出其独特的优势。TeX作为一种历史悠久的排版系统,以其强大的数学公式处理能力和高度的可定制性,依然在学术界和出版界占据重要地位。而Typst作为一...

Read More
2025-02-15 talkingdev

将代码库转换为单一Markdown文档,助力AI模型训练

近日,一项创新技术引起了开发者社区的广泛关注。该技术能够将整个代码库转换为单一的Markdown文档,从而方便地将其输入到AI模型中进行训练和分析。通过这种方式,开发者可以更高效地利用AI工具来理解和优化代码结构...

Read More
2025-02-14 talkingdev

研究人员展示LLM在减少参数的同时保持学习能力

近日,研究人员通过优化技术展示了大型语言模型(LLMs)在减少非embedding参数的同时仍能保持学习能力。研究表明,通过用优化的子网络替换密集层,LLMs可以在减少高达77%的参数的情况下,依然保持与原有模型相当的性...

Read More
2025-02-14 talkingdev

开源LLM复杂函数调用基准测试工具

近日,GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架,以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具,用户可以...

Read More
2025-02-14 talkingdev

论文:Jakiro利用Mixture of Experts优化Speculative Decoding,提升推理速度

近日,Jakiro团队通过引入Mixture of Experts(MoE)技术,成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果,减少了候选预测之间的相关性,从而显著提升了推理速度。Speculative Decoding作...

Read More
2025-02-14 talkingdev

Meta发布MobileLLM:轻量级移动端语言模型新突破

近日,Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化,尽管体积小巧,但性能强大,能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...

Read More
  1. Prev Page
  2. 116
  3. 117
  4. 118
  5. Next Page