漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-15 talkingdev

十年之后,失去的十年(2024)

2024年,科技行业回顾过去十年,发现许多机遇与挑战并存。尽管技术飞速发展,但在某些领域,我们似乎失去了宝贵的十年。从LLM的崛起到agent技术的广泛应用,再到embedding和LoRA的创新,技术的进步显而易见。然而,R...

Read More
2025-02-14 talkingdev

论文:Jakiro利用Mixture of Experts优化Speculative Decoding,提升推理速度

近日,Jakiro团队通过引入Mixture of Experts(MoE)技术,成功优化了Speculative Decoding的性能。该方法通过生成多样化的预测结果,减少了候选预测之间的相关性,从而显著提升了推理速度。Speculative Decoding作...

Read More
2025-02-14 talkingdev

BigQuery推出SQL管道语法公共预览版

近日,Google Cloud宣布其数据仓库服务BigQuery正式推出SQL管道语法的公共预览版。这一新功能允许用户在SQL查询中使用管道符号(|)来简化复杂的数据处理流程。通过管道语法,用户可以将多个操作串联起来,例如数据...

Read More
2025-02-14 talkingdev

MIT探索未来视觉技术:What if Eye...?

在最新的技术探索中,研究人员提出了一个引人深思的问题:What if Eye...? 这一问题不仅挑战了我们对视觉技术的传统认知,还开启了对未来视觉系统可能性的广泛讨论。通过结合先进的LLM和agent技术,科学家们正在开发...

Read More
2025-02-13 talkingdev

DeepMind突破视觉语言模型预训练规模,1000亿图像助力全球任务性能提升

DeepMind近期在视觉语言模型(VLM)预训练领域取得了重大突破,将训练数据规模提升至前所未有的1000亿张图像。这一规模远超以往尝试,显著提升了模型在多样化全球任务中的表现。尽管在西方中心化任务上的性能已趋于...

Read More
2025-02-13 talkingdev

DeepScaleR:通过扩展RL训练,1.5B模型超越O1-Preview

近期,DeepScaleR的研究成果引起了广泛关注。该研究通过扩展强化学习(RL)训练,成功开发出一款1.5B参数的模型,其性能超越了O1-Preview。研究团队采用了一种独特的方法,即在RL训练过程中逐步增加上下文长度,从而...

Read More
2025-02-13 talkingdev

OpenAI公布GPT-5路线图:GPT-4.5将成最后非链式思维模型

OpenAI近日公布了其GPT系列模型的未来发展路线图,计划在推出GPT-5之前,先发布GPT-4.5作为最后一个非链式思维(non-chain-of-thought)模型。GPT-5将实现o-series与GPT-series模型的统一,标志着OpenAI在大型语言模...

Read More
2025-02-13 talkingdev

苹果探索人形机器人技术,预计2028年后量产

苹果公司目前正处于人形机器人和非人形机器人的早期概念验证阶段。据内部消息透露,苹果正在积极研究相关技术,但大规模生产预计不会早于2028年。这一举措标志着苹果在人工智能和机器人领域的进一步扩展,尽管目前仍...

Read More
  1. Prev Page
  2. 38
  3. 39
  4. 40
  5. Next Page