漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-27 talkingdev

本地模型与云端模型协同工作,成本降低83%

Hazy Research的最新研究表明,通过Ollama使用本地模型,并结合长上下文云端模型作为协调器,可以在仅花费17%成本的情况下,实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...

Read More
2025-02-24 talkingdev

OmniServe框架开源,助力大规模LLM高效部署

近日,OmniServe发布了一个全新的统一框架,旨在优化大规模LLM(大语言模型)的部署效率。该框架结合了低比特量化和稀疏注意力机制等创新技术,显著提升了模型推理速度并降低了成本。通过低比特量化,OmniServe能够...

Read More
2025-02-21 talkingdev

梁文峰与DeepSeek的开源AI探索之旅

梁文峰,一位对冲基金经理,推出了自筹资金的开源AI平台DeepSeek,该平台因其创新的LLM(如DeepSeek-R1)而迅速获得全球关注,这些模型可与OpenAI的模型相媲美。DeepSeek采用更具成本效益的训练方法,并兼容消费级硬...

Read More
2025-02-20 talkingdev

新型图书排序算法接近完美,提升信息存储效率

近期,研究人员开发出了一种新型算法,用以解决图书馆书籍排序问题,即如何在最短时间内将新书放置到书架上,并保持某种排序顺序。这一问题同样适用于硬盘和数据库中文件的排列。该算法的效率接近理论上的理想状态,...

Read More
2025-02-18 talkingdev

Mistral Saba:中东与南亚数据驱动的24B参数模型,高效低成本

Mistral Saba是一款基于中东和南亚地区精心策划数据集训练的24B参数模型。尽管其规模仅为同类模型的五分之一,但Mistral Saba在提供更准确和相关响应方面表现出色,同时显著降低了计算成本和响应时间。这一突破性技...

Read More
2025-02-09 talkingdev

渐进式自动化的关键:Do-nothing scripting技术解析

在2019年,Do-nothing scripting作为一种新兴技术,逐渐成为渐进式自动化的关键工具。该技术通过编写脚本来自动化执行一系列任务,而无需人工干预。Do-nothing scripting的核心思想是让脚本在后台运行,自动处理复杂...

Read More
2025-02-04 talkingdev

DeepSeek AI模型颠覆市场,创新或重塑AI竞争格局

DeepSeek的AI模型以其显著低于其他领先模型的训练成本,正在颠覆AI市场。这一突破性进展不仅挑战了Nvidia等科技巨头的地位,还展示了资源高效利用的潜力。传统观念认为,更高的投入意味着更好的性能,但DeepSeek的成...

Read More
2025-01-31 talkingdev

论文:Reqo推出基于Bi-GNN与概率ML的可解释查询优化模型

近日,Reqo推出了一款全新的查询优化模型,该模型结合了双向图神经网络(Bi-GNN)与概率机器学习(ML)技术,旨在提升查询成本估算的准确性。与传统方法不同,Reqo引入了一种创新的可解释性技术,能够突出查询子图的...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page