漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-10 talkingdev

Image In Words数据集,图像与文字配对的新型标签方法

近日,一种新型的标签方法被研究者利用在了图片和文字的配对上,这种方法运用了两次的VLMs(视觉语言模型)扫描,产生了极为详细的图片和文字配对数据。这些配对数据的标题比以往的任何数据集都要详细,能够帮助训练...

Read More
2024-05-08 talkingdev

React的无头用户界面Headless UI v2.0发布

Headless UI v2.0 for React带有内置的锚定定位、新的复选框组件、HTML表单组件、组合框列表虚拟化、新网站、改进文档和改进的悬停、焦点和活动状态检测功能。这些改进旨在帮助开发人员编写更少的代码,并使开发人员...

Read More
2024-05-07 talkingdev

ml-rpm-bench: 视觉-语言模型在视觉推理方面的限制评估

像GPT-4V这样的视觉-语言模型在理解和与图像和文本交互方面正在快速发展。然而,最近的一项研究揭示了它们在视觉推理上的重大限制。研究人员使用复杂的视觉难题,如智商测试中的难题,来测试这些模型,并发现它们在...

Read More
2024-05-07 talkingdev

LeroBot:HF团队开源机器人开发工具库

知名的人工智能研发团队Hugging Face近日发布了一个新的项目,该项目将机器人开发所需的常用工具进行了优雅的打包。这个新的项目在Github上开源,全球的开发者都可以免费使用和贡献。Hugging Face团队一直致力于AI领...

Read More
2024-05-07 talkingdev

Unsloth.ai:轻松微调和训练LLMs的新方式

Unsloth.ai的创始人近期发布了一段视频,详述了他们的团队如何使用PyTorch,编写他们的内核,以及设计他们的API界面。Unsloth的框架和库功能强大,易于使用。Unsloth通过这种方式,使得大量的开发者能够更好地进行深...

Read More
2024-05-07 talkingdev

马斯克计划利用AI技术重塑新闻领域

伊隆·马斯克计划升级X公司的人工智能系统Grok,将其与实时新闻和社交媒体评论进行整合,以提供实时的更新和引用。Grok将根据用户在X公司的讨论生成新闻摘要,重点关注参与度和准确性。然而,这个项目在正确引用和法...

Read More
2024-05-07 talkingdev

Stack Overflow与OpenAI携手合作,共同推出实时数据API

知名编程网站Stack Overflow与OpenAI达成合作,共同提供一种数据API供OpenAI的客户使用,以便获取实时且经过审核的数据。这种API的推出,旨在为开发者提供方便快捷的数据获取方式,推动编程领域的进步和创新。这是St...

Read More
2024-05-06 talkingdev

Penzai:JAX库的新成员,让模型操作和理解变得更简单

近日,JAX库的新成员Penzai亮相。Penzai通过具有可读性的功能Pytree结构,使得对训练模型的操纵和理解变得更加容易。这个库包含了丰富多样的工具,可以用于模型的可视化、调试以及组成部分分析。Penzai的安装和使用...

Read More
2024-05-06 talkingdev

苹果Ajax LLM技术升级iOS18 Siri AI 功能,Safari和Spotlight Search新增AI增强功能

苹果公司即将在iOS 18中,为Safari、Spotlight Search和Siri增强AI相关功能。Safari的其中一个关键功能是文本摘要。 Siri也将获得类似的更新,使其能够以简化的方式生成响应来传递消息的内容。苹果的AI模型将完全在...

Read More
2024-05-04 talkingdev

Dillo 3.1.0开源浏览器发布,时隔9年再度亮相

Dillo是一款快速、小巧、轻便的开源浏览器,最近发布了3.1.0版本。这是第一次更新Dillo已经9年了。这个版本引入了很多新功能,例如它现在支持HTML5,CSS3和SSL。此外,Dillo 3.1.0还包括更好的JavaScript支持,以及...

Read More
  1. Prev Page
  2. 45
  3. 46
  4. 47
  5. Next Page