漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-19 talkingdev

论文:补丁级别训练技术提高LLMs的效率

研究人员提出了针对大型语言模型(LLMs)的补丁级别训练,以提高训练效率。补丁级别训练是一种新的技术,目的是优化大型语言模型的处理能力。这种方法通过在训练过程中引入更精细的补丁级别,提高了模型的训练效率,...

Read More
2024-07-19 talkingdev

OpenAI推出新款小型模型GPT-4o Mini,颠覆GPT-3.5

OpenAI近日推出了一款新型小型模型——GPT-4o Mini,目标是替代现有的GPT-3.5模型。GPT-4o Mini在MMLU(Mixed Multi-Level Understanding)上的得分为82,这对于低成本模型来说是相当合理的表现。OpenAI一直致力于开发...

Read More
2024-07-18 talkingdev

编译器如何识别复杂模式?

编译器在优化代码时会采用多种技术来识别模式,但有时也会选择寻找一些预设好的模式。编译器在执行优化时必须权衡许多因素,包括优化的类型和执行方式。尽管存在一些极其复杂的算法,但可能会因为成本高昂、过于复杂...

Read More
2024-07-18 talkingdev

如何用WASM SQLite加速Notion在浏览器中的运行速度

Notion是一个流行的协作工具,但是在浏览器中使用时,它的性能可能会变得缓慢。为了解决这个问题,Notion团队尝试使用WebAssembly (WASM)和SQLite来加速Notion在浏览器中的运行速度。他们首先将Notion的SQL查询转换...

Read More
2024-07-17 talkingdev

SmolLLM-HF推出高性能小语言模型

Hugging Face近日推出了一套名为SmolLLM的小型语言模型套件,其性能超越许多大型模型。这主要得益于数据集的精心策划和管理。SmolLLM以其精细的设计和优化,展示出了小型语言模型的巨大潜力和价值。这种模型不仅在处...

Read More
2024-07-16 talkingdev

Crawlee:大规模的网络数据采集工具开源

Crawlee是一个全新的工具包,基于多款爬取软件构建,旨在帮助用户大规模地收集网络数据。无论是企业还是个人,都可以通过使用Crawlee来优化和简化网络信息的获取过程。这个工具包将多种爬取软件的优点结合起来,提供...

Read More
2024-07-16 talkingdev

SCALE工具包发布:GPU编程新纪元

Spectral Compute公司近日推出了SCALE——一个通用并行图形处理单元(GPGPU)编程工具包。SCALE的主要创新之处在于它能够使得使用CUDA语言编写的程序原生编译运行在AMD的GPUs上。这个工具包接受现有的CUDA程序代码,作...

Read More
2024-07-15 talkingdev

论文:GBRL梯度提升强化学习,将GBT优势引入强化学习领域

梯度提升强化学习(GBRL)成功地将梯度提升树(GBT)的优势引入到强化学习领域。GBT是一种迭代决策树算法,可以优化损失函数,GBRL将这种方法应用于强化学习中,以提升其性能和效率。通过使用GBT的优势,GBRL能够提...

Read More
  1. Prev Page
  2. 154
  3. 155
  4. 156
  5. Next Page