漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-12 talkingdev

Meta正在开发一款与GPT-4竞争的AI聊天机器人

Meta公司近期在积极采购AI训练芯片,并且正在大规模扩建数据中心,目的在于开发出一款更强大的新型AI聊天机器人,其预期该机器人将与OpenAI的GPT-4具有相似的复杂性和能力。为了实现这一目标,Meta正在大规模投资,...

Read More
2023-09-06 talkingdev

16亿参数模型在人类评估中取得32%的成绩

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始,基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现,将为人工智能模型开发带来革新。通过大规模的参数训练,该模型已经在人类评估(HumanEval...

Read More
2023-09-05 talkingdev

Tiny Llama开源:1.1B参数模型训练

小型羊驼(Tiny Llama)项目旨在为3T代币训练出一个参数为11亿的羊驼2(Llama2)模型。根据扩展规律,这对于计算优化来说无疑是严重的过度训练,但它对于部署优化带来了显著的收益。此次的模型训练打破了传统的优化...

Read More
2023-09-04 talkingdev

DeepMind共同创始人谈如何限制人工智能的负面影响和潜在威胁

DeepMind的三位联合创始人之一Mustafa Suleyman接受了一档时长1小时的播客采访,讨论了限制新兴技术的负面和意外影响的方法以及其他与人工智能相关的话题。Suleyman认为,人工智能和生物技术很快就会让小团体有能力...

Read More
2023-09-04 talkingdev

加州亿万富翁试图建立的城市——‘加州永存’网站正式发布

加州永存是Flannery Associates的母公司,该公司已经在索拉诺县购买了超过50,000英亩的土地,并公布了一个计划中的城市网站。该网站承诺建设一个安全、步行友好、配备太阳能电站和提供良好本地就业机会的城市,这样...

Read More
2023-08-30 talkingdev

人工智能发展的悲观视角

近年来,人工智能(AI)的发展速度令人惊叹。然而,对于当前的AI发展状况以及AI带来的未来改变,有一种悲观的观点。尽管AI带来了许多便利和独特的优势,但是,其后果和潜在风险也不容忽视。AI的发展可能导致大规模的...

Read More
2023-08-25 talkingdev

法律推理基准:测量语言模型在法律框架中的推理能力

在一个大规模的合作努力下,我们构建了一个基准,用于度量语言模型在法律框架中的推理能力。这项工作的关键在于,我们需要警惕已经训练过的模型中的污染。语言模型在训练过程中可能会被各种各样的数据源影响,这些数...

Read More
2023-08-24 talkingdev

通过Deepgram的创业计划创建、启动和扩大语音启用应用

Deepgram的创业计划为初创企业提供了高达10万美元的信用额度,以使用最强大的语音转文本API。这个计划包括对话分离、智能格式化、多语言等功能,初创企业可以立即申请。通过Deepgram的创业计划,开发者可以创建和启...

Read More
2023-08-22 talkingdev

FlexFlow,开源的LLM部署框架

Flex flow LLM部署框架是一款强大的软件,专门设计来支持语言模型在生产系统中的部署。它能够提供高效、灵活的解决方案,以满足各种复杂环境下的部署需求。此外,它还具有出色的兼容性和扩展性,可以与各种主流的语...

Read More
2023-08-21 talkingdev

你可能不需要微调大型语言模型

对于大多数大型语言模型(LLM)应用,微调并非必要。使用少量提示或检索增强生成(RAG)可能是更好的选择。少量提示是指向LLM提供期望输出的示例,而RAG则涉及查询向量数据库,获取LLM未经训练的信息。这意味着,我...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page