漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-01 talkingdev

纽约大学全面开源高性能视觉模型Cambrian-1

纽约大学(NYU)最近推出了一种全面公开、性能卓越的视觉模型Cambrian-1。此模型对文本编码器和数据混合进行了大规模的消融研究。这一技术的开发,将对视觉模型的研发产生深远影响,推动相关技术向前发展。全面开放...

Read More
2024-06-27 talkingdev

深度挖掘:稀疏自编码器(SAEs)的应用与实践

Golden Gate Claude 是一个出色的案例,展示了如何使用SAEs(稀疏自编码器)进行模型的驾驭和解读。该工作为我们提供了一个直观的解释,解释了它是如何工作的,并提供了一些用于训练这些模型的示例代码。自编码器是...

Read More
2024-06-04 talkingdev

MegActor模型开源,实现逼真肖像动画生成

MegActor是一个新型模型,它利用原始驾驶视频来实现更逼真的肖像动画。通过一种新颖的数据生成框架和背景编码技术,MegActor在解决身份泄露和背景干扰问题上取得了令人瞩目的成果。该模型的核心创新在于其数据生成框...

Read More
2024-06-03 talkingdev

KL散度:人工智能中的快速高效距离测量方法

KL散度是一种快速、廉价且强大的方法,用于测量事物之间的一种距离。它在传统和现代人工智能中被广泛使用。这篇文章从视觉和数学角度探讨了这一强大的概念。KL散度,或称Kullback-Leibler散度,是一种用于衡量两个概...

Read More
2024-05-22 talkingdev

GPT-4-Turbo与Claude Opus对比:开发者更青睐哪款模型?

在Hacker News的讨论中,开发者们对比了ChatGPT Plus中的默认模型GPT-4-Turbo和Anthropic的竞争模型Claude Opus。大多数开发者似乎更喜欢Claude Opus,认为它在编码和工程工作方面表现更佳。尽管如此,OpenAI的GPT-4...

Read More
2024-05-20 talkingdev

Agent开发的简单域名售卖网站garple.com

Garple是一个在线销售短小、易于发音的.com域名的网站,这些域名非常适合作为初创公司的名称。令人惊奇的是,该网站上所有的代码都是由一个AI编码代理完成的。这标志着人工智能在编程领域的应用已经步入了一个新的阶...

Read More
2024-05-07 talkingdev

DeepSeek发布200B+参数模型——DeepSeek-V2

DeepSeek近期推出了一个具有超过2000亿参数的模型DeepSeek-V2,其中激活参数达到210亿。无论是在编码还是推理方面,该模型的表现都极为出色。虽然目前尚不清楚其性能是否超过了拥有700亿参数的Llama 3模型,但无疑,...

Read More
2024-05-03 talkingdev

哈佛大学:通信的数学理论[pdf]

《通信的数学理论》是一篇由克劳德·香农发表于1948年的论文,这篇论文奠定了现代通信的数学基础,被誉为通信领域的里程碑之一。论文中提到了很多后来变得非常重要的概念,例如信息熵、信源编码和信道编码等。这些概...

Read More
2024-05-02 talkingdev

亚马逊推出面向企业和开发者的生成式AI助手——Amazon Q

AWS近日推出了Amazon Q,这是一款生成式AI助手,目标是通过利用公司的内部数据来改善软件开发和决策制定过程。Amazon Q不仅为开发者提供了编码、测试和应用开发的便利,同时还通过自然语言交互为商业用户提供了数据...

Read More
2024-05-01 talkingdev

Cognition Labs寻求20亿美元估值,为其AI编码工具Devin融资

正在从加密转向AI的Cognition Labs,正寻求20亿美元的估值为其AI编码工具Devin融资。在AI初创公司估值飙升的趋势中,Cognition的成功反映了行业的增长以及在数据和计算资源上进行重大投资的重要性。像Google和Micros...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page