漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-07 talkingdev

人工智能对劳动力市场的影响比预期慢

麻省理工学院和IBM的研究人员发表了一篇名为《超越AI接触:哪些任务具有计算机视觉自动化的成本效益?》的工作论文,探讨了自动化基于视觉的任务的经济可行性。该论文发现,仅有23%的任务适合自动化。与更具破坏性...

Read More
2024-02-07 talkingdev

CapH-单张照片3分钟生成多样化人像

CapHuman是一个框架,可以通过仅一张参考照片生成人物的多种表情和头部姿态。它巧妙地保持了人物的身份特征,让照片生成的多种人像看起来像是来自同一人。CapHuman使用的是神经网络技术,可以从单张照片中提取出关键...

Read More
2024-02-07 talkingdev

论文:KTO一种新的AI对齐优化方法

Kahneman-Tversky Optimization(KTO)是一种新的方法,用于训练AI模型以更好地与人类思维对齐。通过利用Kahneman&Tversky的前景理论概念,KTO侧重于最大化效用而不仅仅是偏好可能性。这种新的方法可以帮助AI模型更...

Read More
2024-02-06 talkingdev

Ollama发布视觉模型本地部署支持

Ollama最近发布了对视觉模型的支持。Llava 1.6版本更新了支持,包括Python和JavaScript包中的视觉功能。

Read More
2024-02-06 talkingdev

IMG2Music-图像转音乐方案

通过将图像转换为文本,文本转化为提示,提示转化为音乐,可以创建一个引人入胜的图像到音乐的流水线。

Read More
2024-02-06 talkingdev

ChatLLM for VSCode成为GitHub Copilot的开源替代品

ChatLLM for VS Code是AI辅助自动完成的开源替代品。它现在支持任何Ollama模型,以及使用封闭的API模型。在这个自动化和机器学习越来越流行的时代,ChatLLM提供了一种开源替代方案,为人们提供了更多的选择。

Read More
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2024-02-06 talkingdev

Arc正在开发一款代表你浏览的AI智能体

Browser Company正在为其Arc浏览器开发AI技术,使其能够自主浏览网页并向用户呈现相关信息,这与传统搜索引擎不同。Arc浏览器利用人工智能技术,能够不断学习用户的浏览偏好,为用户推荐更符合他们兴趣的网页内容。...

Read More
  1. Prev Page
  2. 111
  3. 112
  4. 113
  5. Next Page