漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-17 talkingdev

开源|字节跳动Seed团队发布Depth Anything 3:通用单/多视图深度估计新突破

字节跳动Seed团队在GitHub开源了Depth Anything 3(DA3)项目,这是深度估计领域的重要进展。该模型通过纯Transformer架构和创新的深度射线表示法,实现了无需相机位姿信息的单视图或多视图图像空间一致性深度估计。...

Read More
2025-11-15 talkingdev

Claude开发者平台推出结构化输出功能,大幅提升API可靠性

Anthropic公司近日在其Claude开发者平台正式推出结构化输出功能的公开测试版,该功能现已在Sonnet 4.5和Opus 4.1模型上开放使用。这项技术突破通过确保API响应严格遵循开发者定义的JSON模式与工具定义,从根本上解决...

Read More
2025-11-06 talkingdev

Pinterest CEO力推开源AI:成本大降,性能卓越,视觉搜索成关键应用

在最新科技战略中,图片社交平台Pinterest宣布将全面采用开源AI模型来驱动其多元化业务场景。公司CEO Bill Ready强调,开源AI不仅显著降低了成本——相比大型模型供应商,费用仅为零头水平,还实现了‘卓越的性能表现’...

Read More
2025-11-06 talkingdev

无需十种AI工具即可部署智能体:OutSystems Agent Workbench平台解析

近日低代码开发平台OutSystems推出的Agent Workbench引发行业关注,该平台通过集成化工具链解决了智能体AI部署的碎片化难题。其核心价值在于提供包含无代码开发界面、安全防护机制与自动化质量评估的一站式解决方案...

Read More
2025-11-05 talkingdev

超越标准大语言模型:线性注意力混合架构与文本扩散模型引领新浪潮

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型,但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升,更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本,在创造...

Read More
2025-11-02 talkingdev

丹麦合规科技公司Formalize完成3000万欧元B轮融资,助力中小企业高效应对欧盟法规

总部位于哥本哈根的合规科技企业Formalize近日宣布完成3000万欧元(约合人民币2.3亿元)的B轮融资,本轮融资由Acton Capital和Blackfin Tech共同领投。该公司开发的合规管理软件目前已服务全球80多个国家的数千家中...

Read More
2025-10-28 talkingdev

Decart推出实时唇形同步API:打造会说话的虚拟数字人

人工智能初创公司Decart与语音技术领军企业ElevenLabs合作,推出开源实时唇形同步API技术。该技术通过实时音频流输入,可生成精准同步的虚拟人像视频与语音输出,支持任意语音引擎与自定义角色配置。这项突破性技术...

Read More
2025-10-27 talkingdev

突破性发现:Claude神经元实现跨模态视觉特征识别,SVG与ASCII艺术触发相同概念响应

Anthropic研究团队在《Circuits Updates – October 2025》中披露了令人振奋的发现:其大型语言模型Claude的内部神经元展现出跨模态理解能力。实验表明,当模型处理文字“眼睛”时激活的特定神经元,在遇到用@符号排列...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page