漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-13 talkingdev

Anthropic模型升级:100k上下文标记突破

Anthropic最新消息,其Claude模型现已可处理更长上下文标记。这意味着,您的组织可以将完整文档输入模型,语言模型将会对其进行操作。他们举了一个例子,将240页编码文档输入Claude,并让其回答编码问题。目前尚未公...

Read More
2023-05-09 talkingdev

新型注意力机制提升网页理解能力

近日,研究人员开发出新的维基百科网页套件(WikiWeb2M),旨在提高多模态网页理解能力,该套件包含200万个网页和一种特殊的注意力机制,可提高生成描述、总结部分和创建上下文图像标题等任务的性能。 ## 主要内容...

Read More
2023-05-09 talkingdev

RasaGPT:首个基于Rasa和Langchain构建的无头LLM聊天机器人平台

**内容摘要:** - RasaGPT是基于Rasa和Langchain构建的首个无头LLM聊天机器人平台。 - 该平台提供了Rasa和Telegram的样板代码和参考实现,利用类似Langchain的LLM库进行索引、检索和上下文注入。 - RasaGPT为开发人...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-03 talkingdev

为什么聊天机器人不是未来

在Wattenberger博客上的这篇文章中,作者批评了聊天机器人,包括那些由人工智能(如ChatGPT)驱动的聊天机器人。作者认为,尽管它们越来越复杂,但聊天机器人经常无法提供有意义和上下文相关的回应。他们还提出了有...

Read More
2023-05-01 talkingdev

自然语言指令控制下的InstructCTG文本生成

InstructCTG是一种受自然语言描述和演示控制的文本生成框架。这种灵活的方法通过少量训练即可在上下文学习和少量任务泛化中实现模型的自适应,并保持生成的质量和速度。以下是该框架的三个核心点: - InstructCTG使...

Read More
2023-04-28 talkingdev

Pinecone 完成1亿美元B轮融资

Pinecone是向量数据库的首选之一,可用于需要语言模型与外部数据交互的场景。将数据嵌入向量,并将其存储在数据库中,可解决上下文长度问题,从而扩展语言模型的长期记忆。该公司最近完成了1亿美元的B轮融资,以下是...

Read More
2023-04-21 talkingdev

微软推出代码集成LLMs的工具包

微软推出了一款名为Semantic Kernel (SK) 的轻量级SDK,可将人工智能大型语言模型(LLMs)与传统编程语言集成。这款创新型模型将自然语言语义功能、本地代码功能和基于嵌入式内存的功能融合在一起,以增强应用程序的...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page