漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-14 talkingdev

开源LLM复杂函数调用基准测试工具

近日,GitHub上发布了一个专门用于评估AI模型在复杂函数调用方面表现的基准测试工具库。该工具库旨在为研究人员和开发者提供一套全面的测试框架,以衡量不同LLM在处理复杂函数调用时的性能。通过这一工具,用户可以...

Read More
2025-02-14 talkingdev

Meta发布MobileLLM:轻量级移动端语言模型新突破

近日,Meta在Hugging Face Hub上发布了其最新研发的MobileLLM模型检查点。这一系列模型专为移动设备优化,尽管体积小巧,但性能强大,能够在资源受限的环境中高效运行。MobileLLM的推出标志着Meta在移动端AI技术领域...

Read More
2025-02-14 talkingdev

AI设计酶:从零开始创造全新生物催化剂

蛋白质设计的终极目标之一是从无到有地构建全新的酶。传统上,科学家通过在自然界中发现酶,然后通过试错方法对它们进行改进和适应。AI的最新进展可能最终引领我们从头开始创建定制酶的道路,但这一过程仍然是一个巨...

Read More
2025-02-13 talkingdev

Phind 2发布:AI搜索新突破,支持视觉答案与多步推理

近日,Phind 2正式发布,标志着AI搜索技术迈入新阶段。Phind 2不仅能够提供传统的文本搜索结果,还引入了视觉答案功能,用户可以通过图像直观获取信息。此外,Phind 2的多步推理能力使其能够处理复杂的查询,通过逐...

Read More
2025-02-13 talkingdev

微软推出Data Formulator:基于语言模型的数据可视化工具

微软近日在GitHub上发布了一款名为Data Formulator的工具,该工具利用语言模型(LLM)帮助用户快速生成图表并回答与数据集相关的问题。Data Formulator通过API密钥与云端模型连接,能够高效处理数据分析和可视化任务...

Read More
2025-02-13 talkingdev

DeepMind突破视觉语言模型预训练规模,1000亿图像助力全球任务性能提升

DeepMind近期在视觉语言模型(VLM)预训练领域取得了重大突破,将训练数据规模提升至前所未有的1000亿张图像。这一规模远超以往尝试,显著提升了模型在多样化全球任务中的表现。尽管在西方中心化任务上的性能已趋于...

Read More
2025-02-13 talkingdev

DeepScaleR:通过扩展RL训练,1.5B模型超越O1-Preview

近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...

Read More
2025-02-13 talkingdev

OpenAI公布GPT-5路线图:GPT-4.5将成最后非链式思维模型

OpenAI近日公布了其GPT系列模型的未来发展路线图,计划在推出GPT-5之前,先发布GPT-4.5作为最后一个非链式思维(non-chain-of-thought)模型。GPT-5将实现o-series与GPT-series模型的统一,标志着OpenAI在大型语言模...

Read More
  1. Prev Page
  2. 73
  3. 74
  4. 75
  5. Next Page