漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-31 talkingdev

HF团队成功复现OpenAI的第一个RLHF代码

HuggingFace团队成功复现了OpenAI的第一个RLHF代码库,该代码库于2019年发布,是引入了一些最初的RLHF(强化学习与人类因素)想法。这个代码库被称为“Generative Pretraining Transformer(GPT)”。通过在计算机上训...

Read More
2023-10-31 talkingdev

微软研究小组开放GPT-3.5-turbo,参数达到20B

微软研究小组在一篇论文中提到,GPT-3.5-turbo(ChatGPT背后的模型)是一个具有20B参数的模型,该小组研究扩散模型用于代码。据称原始模型的参数为175B,因此可能进行了重新训练或蒸馏。

Read More
2023-10-27 talkingdev

分布式映射:在HuggingFace数据集上的实现方法

数据集映射是将转换应用于每个数据点的标准方法。但是在多个GPU上同时进行映射是很困难的。本代码提供了在HuggingFace数据集上实现的优秀函数。

Read More
2023-10-26 talkingdev

ReactAgent自主代理用GPT-4从用户故事中生成和组合React组件

近日,一种名为ReactAgent的试验性自主代理在GitHub上发布了它的最新版本,该代理利用GPT-4从用户故事中生成和组合React组件。ReactAgent的目标是使React开发更高效,使开发人员在开发过程中更多地关注业务逻辑而不...

Read More
2023-10-26 talkingdev

SpellTest:基于Github的AI-to-AI测试

SpellTest是基于Github的一个新项目,旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法,常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误,并自动...

Read More
2023-10-26 talkingdev

Web 组件将超越你的 JavaScript 框架

构建具有长期性需要避免使用不受您控制的依赖项,并坚持不会破坏的标准。

Read More
2023-10-25 talkingdev

AgentTuning:通过多个智能体任务中的交互轨迹来调整LLMs

近日,研究人员开源了名为AgentTuning的GitHub仓库。该仓库提供了一种新的方法来调整语言模型。这种方法通过多个智能体任务中的交互轨迹来训练和调整语言模型,从而更好地适应不同的任务和场景。这种方法可以提高语...

Read More
2023-10-25 talkingdev

DeepSparse:利用稀疏性加速神经网络推理的CPU推理运行时

DeepSparse是一种CPU推理运行时,它利用稀疏性加速神经网络推理。稀疏性是指神经网络中有很多权重为零的连接,DeepSparse利用这些零权重的连接,跳过不必要的计算,从而实现推理加速。DeepSparse是一个开源项目,可...

Read More
  1. Prev Page
  2. 113
  3. 114
  4. 115
  5. Next Page