漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-06 talkingdev

提升医疗影像精度:新算法RaffeSDG开源

科研人员已经研发出一种名为RaffeSDG的新算法,该算法能够在分析来自不同来源的数据时提高医疗影像模型的准确度。RaffeSDG通过加强算法的鲁棒性,使得模型在处理多源数据时的性能有了显著提高。这一进步对于医疗影像...

Read More
2024-05-02 talkingdev

Reka发布内部评估套件 Vibe-Eval,火速赶超顶级玩家

Reka是一家专业训练大型基础模型的公司,尽管资金规模只是顶级玩家的一小部分,但其发展速度却迅速赶超了一些业界最佳参与者。近日,Reka发布了其内部评估套件Vibe-Eval的一个子集,该套件被用于确定其模型的强度。...

Read More
2024-04-27 talkingdev

CFExplainer工具,图神经网络助力安全漏洞检测

近日,一款名为CFExplainer的新工具引起了行业的广泛关注。该工具主要是用于提升AI模型,特别是图神经网络在理解和识别软件安全漏洞方面的能力。图神经网络的出现,让我们能够更加有效地处理和分析结构化数据,尤其...

Read More
2024-04-15 talkingdev

论文-DGMamba框架:采用状态空间模型应对领域泛化挑战

DGMamba框架是一种创新的技术,它利用状态空间模型Mamba来解决领域泛化中的挑战。状态空间模型是一种先进的机器学习方法,通过将系统状态表示为一组变量,并预测其在时间上的演变,从而提高模型的泛化能力和对新场景...

Read More
2024-04-12 talkingdev

奈飞采用预测性容器CPU隔离技术提升性能和稳定性

随着计算机架构设计的发展,为了隐藏延迟,缓存层级在计算单元与主存之间不断增加。这些缓存在CPU之间部分共享,导致无法完全隔离共同托管容器的性能。奈飞的团队通过将CPU隔离的责任从操作系统转移到基于数据的解决...

Read More
2024-04-08 talkingdev

Qwen团队发布32B参数模型,实现强大性能并适应中等内存系统

Qwen团队最新力作——一个具备32B参数的AI模型,现已成功训练并对外发布。该模型在各类任务中展现出卓越的性能表现,同时其设计考虑到了内存的局限性,能够适配更为普遍的中等内存硬件系统。这意味着,即便是在资源有...

Read More
2024-04-02 talkingdev

LLMs如何引领RPA流程自动化新时代

尽管RPA(机器人流程自动化)在早期取得了一些成功,但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示,仅有3%的公司能够成功扩大其RPA项目规模。然而,人工智能的最新进展有望改变这一现状。大型语言...

Read More
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-03-26 talkingdev

软件工程面试中的最优问题解析

本篇博客文章深入探讨了一次软件工程面试中的编程挑战。挑战涉及给内存中键值存储系统memcached增加一个`mult`命令,用以实现原子乘法操作。memcached虽然内置了原子加法操作,但并未提供其他算术运算。这个挑战非常...

Read More
2024-03-22 talkingdev

Cohere推出面向企业级应用的Command-R模型,即将登陆NVIDIA API目录

Cohere近日推出了专为大规模生产而优化的RAG(Retrieval-Augmented Generation)模型Command-R,并宣布将该模型引入NVIDIA新推出的API目录。Command-R模型结合了检索与生成技术,能够助力企业快速进入大规模生产环境...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page