漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-09 talkingdev

用C/CUDA语言训练大型语言模型,无需依赖PyTorch

近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...

Read More
2024-04-04 talkingdev

探索多样化的文件系统APIs

搜索'文件系统API'可能会让你看到许多名字相似的APIs,这很容易引起混淆。由于存在多个标准和名称,但实际上比你第一眼看到的要少,许多API都是相互构建的,增加了功能的层次。本文将为你介绍不同的文件系统APIs。与...

Read More
2024-04-03 talkingdev

AutoQuant 笔记本:将 HuggingFace 模型转换为五种不同的量化格式

AutoQuant 笔记本是一个新的工具,它可以将 HuggingFace 上的模型导出为五种不同的量化格式,包括 GGUF、GPTQ、EXL2、AWQ 和 HQQ。这些量化格式旨在优化模型的性能和效率,以便在不同的硬件和平台上部署。通过使用 A...

Read More
2024-04-03 talkingdev

Replit Teams,加入AI编程助手竞争

Replit公司近日发布了一款名为Replit Teams的全新工具,旨在帮助开发者实现实时合作开发软件项目。该工具的独特之处在于集成了一个AI Agent,能够自动检测并修复代码中的错误。这一创新将极大地提高开发团队的工作效...

Read More
2024-04-03 talkingdev

创新公司颠覆AI模型开发高成本观念

YC支持的25家创业公司通过培训或微调自有的基础模型,打破了构建AI模型需要巨额资源的传统观念。这些公司在短时间内取得了显著成就,如创造专业音乐和设计新型蛋白质。这些公司利用YC的资金和技术支持,跨越不同领域...

Read More
2024-04-03 talkingdev

开源攻击事件时间线揭秘

近期,名为'Jia Tan'的攻击者实施了针对广泛使用的开源软件库xz的首次严重的供应链攻击。在攻击发生前,Jia Tan作为xz压缩库的一名贡献者,已经勤奋高效地工作了两年多。此次攻击事件引起了开源社区的广泛关注,对开...

Read More
2024-04-03 talkingdev

SWE-agent,问题的修复率达到12%

普林斯顿大学的软件工程小组近日开源了一款名为“SWE-agent”的工具,该工具可以帮助开发者在GitHub上提高问题修复率。该小组在GitHub上发布了800个问题以供参考,工具通过学习这些问题并分析代码库中的代码,能够快速...

Read More
2024-04-02 talkingdev

微软推出面向初学者的生成型人工智能课程

微软在其广受欢迎的大型语言模型(LLMs)、向量数据库、提示技术以及低代码应用课程的基础上,发布了第二版的课程内容,现已上线GitHub。该课程共包含18课,虽然部分内容具有前瞻性,但依然是踏入该领域的良好起点。...

Read More
2024-04-01 talkingdev

Airtable AI产品发布,将人工智能融入工作流程

Airtable公司近日推出了一款名为Airtable AI的新产品,旨在将人工智能技术直接整合到用户的日常工作流程中。这款产品通过简化AI集成过程,使得用户无需深入了解复杂的人工智能算法和编程语言,也能轻松地利用AI技术...

Read More
2024-04-01 talkingdev

EvoEval:全新代码基准测试套件,全面提升大型语言模型编程能力评估

EvoEval是一套全新的基准测试工具,专为评估大型语言模型(LLMs)的编码能力而设计。该测试套件采用了比以往更加严格的测试标准,以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page