漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

Eleuther发布Pile-T5:现代AI编码任务的升级版基础模型

Eleuther团队近期对T5模型进行了重新训练,采用了现代的分词器并延长了训练时间。T5作为现代AI领域的一匹黑马,此次升级后的Pile-T5模型在编码任务上表现出了显著的性能提升。经过持续的优化和调整,Pile-T5在多项基...

Read More
2024-04-15 talkingdev

BabyLM挑战赛:探索用婴儿级数据训练顶级文本与视觉模型

近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...

Read More
2024-04-15 talkingdev

谷歌发布新一代AI芯片,挑战Nvidia、微软和亚马逊

谷歌宣布其最新的人工智能芯片Cloud TPU v5p现已问世。这款芯片的训练速度是前代TPU v4的近三倍,尤其在大型语言模型的训练上表现出色。这一发布进一步巩固了谷歌在AI硬件领域与其他竞争对手如Nvidia的竞争优势。同...

Read More
2024-04-15 talkingdev

xAI发布Grok-1.5视觉预览,性能媲美顶尖模型

xAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...

Read More
2024-04-15 talkingdev

PostgreSQL性能提升新利器:Index Advisor扩展发布

PostgreSQL Index Advisor是一个专为PostgreSQL设计的扩展工具,旨在通过推荐创建特定索引来提升数据库查询性能。该工具支持通用参数和物化视图,能够识别通过视图混淆的表和列,从而帮助开发者优化数据库结构,减少...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-12 talkingdev

Mistral推出新型8x22B模型,性能卓越

Mistral公司近日发布了一款新型的8x22B模型,并通过磁力链接供用户下载体验。根据社区首批基准测试结果显示,该模型作为基础模型表现突出,其77 MMLU(与推理能力密切相关的指标)得分令人瞩目。这一新模型的出现,...

Read More
2024-04-12 talkingdev

Cohere推出Rerank 3模型,助力企业搜索与RAG升级

Cohere公司近日发布了其最新的基础模型——Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,R...

Read More
2024-04-12 talkingdev

奈飞采用预测性容器CPU隔离技术提升性能和稳定性

随着计算机架构设计的发展,为了隐藏延迟,缓存层级在计算单元与主存之间不断增加。这些缓存在CPU之间部分共享,导致无法完全隔离共同托管容器的性能。奈飞的团队通过将CPU隔离的责任从操作系统转移到基于数据的解决...

Read More
2024-04-11 talkingdev

Elon Musk发布升级版Grok AI 提升编程与数学能力

Elon Musk旗下的xAI公司近日推出了Grok-1.5人工智能系统,该系统在数学和编程方面的处理能力得到了显著提升。与前一版本相比,Grok-1.5在性能上有大幅度提升,并在与业界领先的AI模型如GPT-4的竞争性基准测试中表现...

Read More
  1. Prev Page
  2. 45
  3. 46
  4. 47
  5. Next Page