漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-14 talkingdev

研究人员展示LLM在减少参数的同时保持学习能力

近日,研究人员通过优化技术展示了大型语言模型(LLMs)在减少非embedding参数的同时仍能保持学习能力。研究表明,通过用优化的子网络替换密集层,LLMs可以在减少高达77%的参数的情况下,依然保持与原有模型相当的性...

Read More
2025-02-14 talkingdev

开源LLM复杂函数调用基准测试工具

近日,GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架,以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具,用户可以...

Read More
2025-02-14 talkingdev

论文:Jakiro利用Mixture of Experts优化Speculative Decoding,提升推理速度

近日,Jakiro团队通过引入Mixture of Experts(MoE)技术,成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果,减少了候选预测之间的相关性,从而显著提升了推理速度。Speculative Decoding作...

Read More
2025-02-14 talkingdev

Meta发布MobileLLM:轻量级移动端语言模型新突破

近日,Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化,尽管体积小巧,但性能强大,能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...

Read More
2025-02-14 talkingdev

MIT探索未来视觉技术:What if Eye...?

在最新的技术探索中,研究人员提出了一个引人深思的问题:What if Eye...? 这一问题不仅挑战了我们对视觉技术的传统认知,还开启了对未来视觉系统可能性的广泛讨论。通过结合先进的LLM和agent技术,科学家们正在开发...

Read More
2025-02-13 talkingdev

Page Assist开源:本地语言模型助力网页浏览

近日,GitHub上发布了一款名为Page Assist的新工具,旨在通过本地语言模型(LLM)提升网页浏览体验。Page Assist作为众多新兴工具之一,专注于利用本地化的语言处理能力,为用户提供更高效、个性化的网页浏览支持。...

Read More
2025-02-13 talkingdev

微软推出Data Formulator:基于语言模型的数据可视化工具

微软近日在GitHub上发布了一款名为Data Formulator的工具,该工具利用语言模型(LLM)帮助用户快速生成图表并回答与数据集相关的问题。Data Formulator通过API密钥与云端模型连接,能够高效处理数据分析和可视化任务...

Read More
2025-02-13 talkingdev

OpenAI公布GPT-5路线图:GPT-4.5将成最后非链式思维模型

OpenAI近日公布了其GPT系列模型的未来发展路线图,计划在推出GPT-5之前,先发布GPT-4.5作为最后一个非链式思维(non-chain-of-thought)模型。GPT-5将实现o-series与GPT-series模型的统一,标志着OpenAI在大型语言模...

Read More
  1. Prev Page
  2. 26
  3. 27
  4. 28
  5. Next Page