漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-15 talkingdev

论文:大语言模型的隐私保护能力

随着大型语言模型与外部工具的配对越来越多,数据泄露的新风险已经出现。本文介绍了一种系统性的方法来评估这些人工智能系统保护私人信息的能力。 研究人员发现,当前的大型语言模型在保护隐私方面存在一些问题。它...

Read More
2024-02-14 talkingdev

苹果发布多模态LLM指导下的图像编辑代码

苹果发布了一款新的代码,使用多模态语言模型来改进人类提供的自然语言图像编辑。这个新的代码的核心思想是使用大型语言模型来指导用户对图像进行编辑,从而提高编辑的质量和效率。该代码的具体实现是将图像与自然语...

Read More
2024-02-14 talkingdev

SGLang:针对LLM设计的结构生成语言

SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法,使用户能够更好地控制生成的文本。此外,它还提供了一些实用工具,如生成...

Read More
2024-02-13 talkingdev

Chess-GPT:探索LLM的国际象棋AI内部世界

本研究着眼于一个基于大型语言模型的国际象棋AI是如何工作的。该AI使用了GPT-2和GPT-3模型,并通过对棋盘上的棋子和动作进行编码来训练自己。研究人员还探索了AI模型内部的世界,包括其理解和预测对手的能力,以及在...

Read More
2024-02-12 talkingdev

FunSearch:利用LLM在数学科学领域的新发现

FunSearch是一种新的AI驱动方法,它将大型语言模型与评估算法相结合,已经在数学科学领域做出了可验证的发现,包括解决了长期存在的cap set问题和更高效的bin-packing问题算法。它引入了演化方法来生成和评估代码,...

Read More
2024-02-09 talkingdev

论文:挑战多模态语言模型的新基准测试

一项新研究揭示了多模态大型语言模型(MLLMs)如GPT-4V的一个弱点:它们难以处理特定类型的图像-文本输入,从而导致错误。CorrelationQA是一个基准测试,旨在评估MLLM在图像可能会误导或与文本相矛盾的情况下的表现...

Read More
2024-02-08 talkingdev

移动端本地微型语言模型大有可为

近日,一项研究探讨了如何通过采用参数更少的微型语言模型,使得强大的语言模型更适合移动设备。研究人员发现,相较于传统的大型语言模型,微型语言模型在保证语言表达能力的前提下,可以极大地减少模型参数,从而显...

Read More
2024-02-07 talkingdev

Roblox发布实时AI聊天翻译器,打破语言壁垒

Roblox开发了一种AI模型,能够实时翻译16种语言的文本聊天,以打破语言壁垒,增强用户参与度。该模型利用基于转换器的大型语言模型,在混合专家架构中实现了高效的资源利用,同时保持了其隐私和安全流程。

Read More
2024-02-02 talkingdev

微软利用激光技术解决LLM幻觉问题

1月份微软研究论坛上,Dipendra Misra提出了一种名为“Layer-Selective Rank Reduction(LASER)”的技术,通过用一个较小的近似矩阵替换权重矩阵,提高了大型语言模型(LLM)的准确性。

Read More
2024-02-02 talkingdev

Mistral CEO确认泄露的新开源AI模型接近GPT-4的性能

AI社区因HuggingFace和4chan分享的一个名为“miqu-1-70b”的泄漏大型语言模型而感到兴奋。该模型表现出能与OpenAI的GPT-4相媲美的性能,并与Mistral的Mixtral 8x7b有关。Mistral的CEO确认这是一位热情的客户泄露的,这...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page