漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-15 talkingdev

Jina AI阅读器开源:将网页转换为LLM友好的Markdown格式

Jina AI最新推出了一款名为'LLM friendly HTML conversion'的GitHub项目,该项目旨在将网络链接转换为适用于大型语言模型(LLM)的友好Markdown格式。这一工具的开发,将极大地便利开发者和研究者利用LLM进行各种任...

Read More
2024-04-15 talkingdev

论文:操纵大型语言模型以提升产品曝光度

近期研究发现,通过在产品描述中添加策略性文本序列,可以操纵搜索引擎中的大型语言模型,从而使特定产品获得更多曝光。这种方法利用了语言模型对于文本语义的解析能力,通过特定关键词和表述的优化,影响搜索结果的...

Read More
2024-04-15 talkingdev

谷歌发布新一代AI芯片,挑战Nvidia、微软和亚马逊

谷歌宣布其最新的人工智能芯片Cloud TPU v5p现已问世。这款芯片的训练速度是前代TPU v4的近三倍,尤其在大型语言模型的训练上表现出色。这一发布进一步巩固了谷歌在AI硬件领域与其他竞争对手如Nvidia的竞争优势。同...

Read More
2024-04-15 talkingdev

初创公司Truss分享使用GPT技术的七大经验教训

本文总结了专注于文本处理的初创公司Truss在过去六个月内发布数个基于大型语言模型(LLM)的功能中获得的七项宝贵经验。这些经验涵盖了如何改进提示方式、工具使用、GPT技术的最佳实践、以及GPT的局限性等方面。Trus...

Read More
2024-04-12 talkingdev

大模型如何理解概念:研究揭示层次处理机制

近期一项研究深入探讨了大型语言模型中不同概念的理解方式。该研究发现,在这些模型中,简单任务通常由较浅的层次处理,而更复杂的任务则需要更深层次的处理能力。这一发现有助于我们更好地理解人工智能在处理信息时...

Read More
2024-04-11 talkingdev

Ada-LEval:全新基准测试,挑战理解长文本的能力

近期,Ada-LEval这一新基准测试的发布,旨在严格评估大型语言模型处理长篇及超长文本的理解能力。随着人工智能技术的不断进步,语言模型在处理文本信息方面的能力也越来越受到关注。Ada-LEval的推出,不仅为研究人员...

Read More
2024-04-10 talkingdev

苹果新AI模型助力Siri理解iOS应用界面

苹果公司开发了一款名为Ferret-UI的多模态大型语言模型(LLM),该模型具备理解移动设备用户界面的能力,有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...

Read More
2024-04-10 talkingdev

SqueezeAttention技术助力LLM优化,内存使用降低30%至70%

近日,开发者社区GitHub上出现了一项名为SqueezeAttention的新技术,该技术针对大型语言模型(LLMs)的键值缓存进行了优化。通过SqueezeAttention,内存使用量能够显著降低30%至70%,同时吞吐量也得到了翻倍提升。这...

Read More
2024-04-10 talkingdev

Chemistry Bench:针对语言模型的化学问题测试基准

近日,GitHub上发布了一项新的基准测试工具——化学工作台(Chemistry Bench),旨在评估大型语言模型在处理化学问题方面的能力。该工具与Big-Bench兼容,能够对语言模型的科学素养进行有效衡量。化学工作台通过一系列...

Read More
2024-04-10 talkingdev

人工智能数据竞赛的四个关键看点

人工智能的发展,尤其是像GPT-3这样的大型语言模型,严重依赖于大量数据。随着高质量在线数据可能在2026年耗尽,科技公司如Meta和Google正竞相收集更多数据。这些科技巨头采用有争议的方法来推动他们的AI进步,包括...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page