漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-06 talkingdev

Nous研究使用Yarn方法优化Mistral 7B模型,可处理长达128k的语境

Nous研究利用他们的Yarn方法对Mistral 7B进行了微调,可以处理长达128k的语境。它在短序列长度上显示出最小的退化,并在长文档上大大提高了性能。

Read More
2023-11-06 talkingdev

产品/市场契合度:经验与数据

达到产品/市场契合度的公司表现出相同的典型度量曲线和主观体验。这种契合度是指公司的产品能够满足市场需求,并在市场中得到广泛接受。通过深入了解客户需求、市场竞争和产品优劣等因素,公司可以优化产品设计、市...

Read More
2023-11-03 talkingdev

Nous Research运用Yarn方法,将Mistral 7B模型扩大到128k上下文

Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。

Read More
2023-11-02 talkingdev

AI技术助力SEO优化:关键词生成器推出

近日,一款基于人工智能技术的关键词生成器正式推出。该产品可以自动分析网站内容,并根据内容特点生成最优化的关键词,为网站SEO优化提供帮助。据悉,该产品适用于各类网站类型,包括企业官网、电商平台等。用户只...

Read More
2023-11-01 talkingdev

苹果推出Scary Fast活动:四大重磅发布

苹果在Scary Fast活动上揭示了最新版自家芯片的全新Mac。苹果的M3、M3 Pro和M3 Max芯片是使用3纳米工艺制造的首批PC芯片。它们配备了更新的GPU,支持光线追踪、网格着色和动态缓存等内存优化功能。新的Mac产品包括24...

Read More
2023-10-31 talkingdev

AI基础设施的半衰期

人工智能中的基础设施层面由于硬件快速发展、激烈的优化竞争、快节奏的研究、长时间的反馈循环、其他层面的模糊性以及基础设施组件的商品化而快速变化。

Read More
2023-10-31 talkingdev

HF团队成功复现OpenAI的第一个RLHF代码库

HuggingFace团队成功复现了OpenAI的第一个RLHF代码库,该代码库于2019年发布,是引入了一些最初的RLHF(强化学习与人类因素)想法。这个代码库被称为“Generative Pretraining Transformer(GPT)”。通过在计算机上训...

Read More
2023-10-31 talkingdev

AMD发布第二轮训练,为大型语言模型训练提供更强的支持

MosaicML发布了一篇关于使用AMD GPU进行大型语言模型训练的文章。该公司在本文中介绍了他们的最新研究结果,使用AMD Radeon Instinct MI100 GPU对GPT-2、GPT-3和T5等大型语言模型进行了训练。结果显示,使用AMD GPU...

Read More
  1. Prev Page
  2. 114
  3. 115
  4. 116
  5. Next Page