漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-04 talkingdev

论文:提升大型语言模型的错误识别能力

最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...

Read More
2023-08-03 talkingdev

大型语言模型系统与产品的设计模式

本文讨论了将大型语言模型集成到系统和产品中的实用模式。它结合了学术研究、行业资源和从业者的专业知识。本文介绍了七种关键模式,涵盖了提高性能与降低成本/风险以及更接近数据与更接近用户之间的一系列模式。

Read More
2023-08-01 talkingdev

当GPT-3.5的成本低于Llama 2时

训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本,并且受到不同计算资源的瓶颈制约。因此,某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵。这篇博客写得非常优雅,围绕模型部署考虑问题有一些非常好的...

Read More
2023-07-28 talkingdev

Stack Overflow推出OverflowAI, 加强平台AI整合功能

Stack Overflow近日宣布推出OverflowAI计划,计划将生成式人工智能技术整合到平台中。该计划包括增加新的搜索能力、能够在几分钟内创建和整理知识库、Slack集成、Visual Studio Code插件以及专门的AI资源和专家回答...

Read More
2023-07-24 talkingdev

“蓝领AI”之路:AI农场工人与仓库操作员的崛起

尽管人工智能(AI)可能使部分工人失去工作机会,但同时也为其他工人创造了新的职业领域。Myra Oldan在探讨AI时代的蓝领工作2.0时,发现了AI农场工人和仓库操作员等新兴职业。在未来,AI技术可以在农场、仓库等领域...

Read More
2023-07-24 talkingdev

纯C语言实现的Llama 2训练与推理库开源

Andrej Karpathy 编写了一个受到llama.cpp极大启发的酷炫库,可以用于纯C语言训练和推理新的Llama 2模型。这个库对于那些对底层编程感兴趣的人来说是一个很好的资源(就像他的所有代码一样)。GPT4在编写过程中给予...

Read More
2023-07-24 talkingdev

LangChain推出LangSmith平台助力开发者优化LLM应用

近日,LangChain宣布推出LangSmith平台,旨在帮助开发者将LLM应用从原型阶段推向生产。LangSmith平台提供了调试、测试、评估和监控等功能,致力于解决LLM应用开发者面临的常见难题。随着人工智能和机器学习技术的不...

Read More
2023-07-19 talkingdev

改善视频深度稳定性的新型工具(GitHub Repo)

最近,一篇新的研究论文介绍了一种名为“神经视频深度稳定器”的新方法,可以在视频中提供一致且准确的深度估计。同时,研究团队还发布了有史以来最大的自然场景视频深度数据集,名为“野生视频深度”。通过这种新的方法...

Read More
  1. Prev Page
  2. 56
  3. 57
  4. 58
  5. Next Page