漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-09 talkingdev

用C/CUDA语言训练大型语言模型,无需依赖PyTorch

近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...

Read More
2024-04-09 talkingdev

Meta旗下的Threads向开发者开放API并发布文档

Meta公司的Threads近日发布了开发者文档,并推出了API接入申请表,计划在6月公开推出其API。这份文档详细说明了API当前的限制和端点。开发者可以利用该API追踪分析数据、发布帖子和媒体内容等。Threads账户每次API发...

Read More
2024-04-08 talkingdev

AI本地搜索新突破:LocalSearch开源

LocalSearch 是一个基于LLM Agents的完全本地运行的搜索引擎。该技术允许用户在不依赖外部服务器的情况下,实现高效的本地数据检索。这一创新性项目已经在GitHub上开源,开发者可以自由地下载和使用。LocalSearch 的...

Read More
2024-04-08 talkingdev

ReFT:一种高效节省参数的微调语言模型方法

近期在GitHub上发布的ReFT(Representation Fine-Tuning)项目,为微调语言模型带来了一种新的参数高效方法。与传统的PeFT相比,ReFT在保持强大性能的同时,大大降低了成本。该方法通过精细化调整模型参数,使得在进...

Read More
2024-04-08 talkingdev

论文:ReaLMistake基准测试,系统识别大型语言模型错误

研究人员近日推出了ReaLMistake基准测试工具,该工具专注于系统性地检测大型语言模型(LLM)响应中的错误。随着人工智能技术的发展,大型预训练语言模型在多种应用场景中展现出了卓越的性能。然而,这些模型在生成文...

Read More
2024-04-08 talkingdev

AMD 开源 Radeon GPU 固件以促进 AI 框架发展

AMD 宣布将开源其 Radeon GPU 的固件,这一决定意味着技术社区将能够快速改进人工智能框架,同时也可能提高 AMD 产品的市场接受度。开源固件将使得独立开发者和研究人员能够更深入地了解和修改 GPU 底层功能,从而推...

Read More
2024-04-08 talkingdev

Opera浏览器开发分支推出本地运行大型语言模型支持

Opera公司旗下的Opera One开发者浏览器近日宣布,现已支持本地运行150种不同的大型语言模型,这些模型来自50个不同的大型语言模型家族。用户无需连接互联网,即可在本地运行这些模型,但需先下载相应的模型文件。此...

Read More
2024-04-08 talkingdev

开发者大吐苦水:分享你最无用的项目经历(Hacker News讨论)

在软件开发的世界里,有时候任务的分配似乎并不总是有意义的。一个在Hacker News上的讨论串揭示了这一点,许多开发者分享了他们曾经参与过的看似毫无用处的项目。这些项目包括为已经废弃的工具进行修复、制作内部工...

Read More
  1. Prev Page
  2. 191
  3. 192
  4. 193
  5. Next Page