漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-22 talkingdev

Phi-3 14B模型升级:性能媲美Command R 104B

Phi-3系列的小型模型迎来了14B版本的升级。此次升级的14B版本表现出色,其性能与Command R(104B模型)相媲美。Phi-3 14B模型的改进使其在处理复杂任务和数据分析方面有了显著提升,成为行业内备受瞩目的新星。Huggi...

Read More
2024-05-22 talkingdev

论文:基于LLMs的文本分类智能专家系统

智能专家系统是一种利用大型语言模型(LLMs)进行文本分类的新方法。该系统通过减少对广泛的预处理和领域专业知识的需求,大大简化了文本分类过程。LLMs具备强大的自然语言处理能力,能够更高效地理解和分类复杂的文...

Read More
2024-05-22 talkingdev

GPT-4-Turbo与Claude Opus对比:开发者更青睐哪款模型

在Hacker News的讨论中,开发者们对比了ChatGPT Plus中的默认模型GPT-4-Turbo和Anthropic的竞争模型Claude Opus。大多数开发者似乎更喜欢Claude Opus,认为它在编码和工程工作方面表现更佳。尽管如此,OpenAI的GPT-4...

Read More
2024-05-22 talkingdev

llava-align:校正视觉语言模型中的关键偏差技术突破

在大型视觉语言模型(LVLMs)中,输出结果往往更倾向于语言模型的先验知识,而非实际的视觉输入。这一项目通过引入“校准”和“去偏采样”技术,有效减少了这种偏差。这些技术使得模型在处理各种任务时,能够生成更加准...

Read More
2024-05-21 talkingdev

SoundHound AI与Perplexity合作,提供精准、最新的网络查询回应

近日,知名的语音识别和自然语言处理技术提供商SoundHound的AI聊天助手宣布将与Perplexity进行合作。Perplexity是一家专注于提供精准、最新的网络查询回应的公司,其技术在搜索引擎、聊天机器人等领域有着广泛应用。...

Read More
2024-05-21 talkingdev

Llama 3的秘密何在?Meta的语言模型在英语聊天机器人领域取得突破

Meta的Llama 3-70B语言模型在英语聊天机器人领域超越了竞争对手,尤其在开放式创新任务中表现出色,但在处理更技术性的提示时却显得吃力。分析显示,随着提示变得更具挑战性,Llama 3的胜率有所下降,但在友好、会话...

Read More
2024-05-21 talkingdev

研究人员发现针对视觉变换器(Vision Transformers)的新型后门攻击手法

近日,研究人员发现了一种针对视觉变换器(Vision Transformers)的新型安全威胁。这种被命名为“SWARM”的攻击手法,利用一个“切换令牌”秘密激活模型中的后门行为,使其对用户具有高度的隐蔽性和危险性。视觉变换器是...

Read More
2024-05-21 talkingdev

从零开始构建Llama 3(保姆级教程)

与其说下载语言模型权重并利用各种工具运行它们是一件容易的事,不如说更难的是准确理解代码本身在做什么。这份出色的教程详细展示了如何重建Llama 3并运行训练后的权重的每一个步骤。从安装必要的环境,编写代码,...

Read More
  1. Prev Page
  2. 250
  3. 251
  4. 252
  5. Next Page