漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-15 talkingdev

Gemini多模态能力初探

Gemini在各种视觉任务中比许多开放模型表现更好。它在相同任务中似乎与GPT-V竞争力十足。

Read More
2023-12-15 talkingdev

Cerebras发布gigaGPT模型训练框架

Cerebras是一家人工智能训练芯片制造商,近日发布了一个在其系统上训练大型模型的框架,名为gigaGPT。该框架非常简单易用,不需要将大型模型分割成多个GPU和节点进行训练。

Read More
2023-12-15 talkingdev

Google推出Imagen2,提供文本和标志生成功能

Google推出了Imagen 2,这是一种增强的AI图像模型,可供经批准的Google Cloud Vertex AI用户使用,提供文本渲染,标志以及多语言翻译等新功能。Imagen 2可以通过Google Cloud的AutoML API和Vision API实现。该模型使...

Read More
2023-12-15 talkingdev

SvelteKit 2发布!支持Vite 5,增加浅层路由功能

SvelteKit是使用Svelte构建应用程序的官方框架。版本2.0增加了对Vite 5的支持和其他小的改进。它还增加了浅层路由功能,允许开发人员将状态与历史记录条目关联而不会导致导航。浅层路由对于创建可以通过向后滑动或弹...

Read More
2023-12-15 talkingdev

Natrue:DeepMindAI在未解问题上超过了人类数学家

FunSearch是一种人工智能系统,可以与特别训练的大型语言模型进行交互,创建生成数学问题解决方案的计算机程序。该系统会检查这些解决方案是否优于已知的解决方案,如果不是,它会向LLM提供反馈,以便下一轮改进。它...

Read More
2023-12-13 talkingdev

科学家Randy Cogill教你如何使用强化学习构建Agent

Interview Kickstart将提供这个免费的实践课程!学习强化学习、Q-learning算法和Gymnasium(OpenAI Gym)。现在就保存您的座位吧!

Read More
2023-12-13 talkingdev

Triton手写常见模型梯度提升AI训练30倍

近期,Triton手写常见模型梯度加速 AI 训练的项目备受关注。该项目手写了一些常见模型的梯度,以加速训练过程。尽管该项目的基准测试结果并不是最具说服力的,但这是一项非常值得尝试的努力。根据测试结果,该项目能...

Read More
2023-12-13 talkingdev

HuggingFace 发布 Transformers 4.36.0 版本,新增 Mistral 模型和 AMD 支持

近日,HuggingFace 发布了最新版本的 Transformers 4.36.0。此次更新新增了 Mistral 模型和 AMD 支持等多项功能。同时,safetensors 已成为默认设置。HuggingFace 的这次更新将为 AI 模型的开发和训练提供更加便利的...

Read More
  1. Prev Page
  2. 827
  3. 828
  4. 829
  5. Next Page