漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-16 talkingdev

Meta FAIR团队发布支持分子属性预测、扩散建模和语言学习神经科学的新数据集与模型

Meta旗下FAIR(基础人工智能研究)团队近日宣布推出多项重要开源成果,涵盖三大前沿领域:1) 分子属性预测数据集与模型,将加速药物发现与材料科学研发流程;2) 扩散模型(Diffusion Models)相关资源,为当前最热门...

Read More
2025-05-15 talkingdev

Perplexity与PayPal达成合作,推动AI搜索直接交易

继OpenAI与Shopify集成后,AI搜索公司Perplexity宣布与支付巨头PayPal达成战略合作,将在其AI搜索结果中直接嵌入PayPal支付功能,实现无缝交易闭环。这一举措标志着生成式AI搜索向'智能体商务'(Agentic Commerce)迈...

Read More
2025-05-14 talkingdev

微软计划在Azure AI Foundry上托管马斯克的Grok AI模型

微软正计划在其Azure AI Foundry平台上托管埃隆·马斯克开发的Grok人工智能模型,这一举措可能将于5月19日举行的微软Build开发者大会上正式宣布。尽管微软与OpenAI存在潜在竞争关系,但这一战略部署凸显了微软意图通...

Read More
2025-05-14 talkingdev

[开源]UCGM:统一框架实现连续生成模型的训练与采样

加州大学团队在GitHub开源了UCGM项目,为生成式AI领域带来突破性技术框架。该项目创新性地构建了统一架构,可同时支持多步(如扩散模型)和少步(如流模型)连续生成模型的训练与采样流程。通过数学层面的抽象整合,...

Read More
2025-05-14 talkingdev

视觉自回归方法EAR开源:无需量化的连续空间生成技术

近期GitHub开源项目EAR提出了一种突破性的视觉自回归生成方法,通过采用严格适当评分规则(如能量评分)绕过了传统量化步骤,直接在连续数据空间中进行生成。该技术摒弃了传统概率建模的约束,通过数学上严谨的评分...

Read More
2025-05-14 talkingdev

TikTok推出AI Alive功能:静态照片秒变动态视频

TikTok近日正式发布名为AI Alive的创新功能,该技术通过智能编辑工具将用户上传的静态照片转化为具有动态效果的短视频,并应用于Stories板块。这一功能依托于先进的图像识别与生成式AI技术,能够自动分析照片内容并...

Read More
2025-05-07 talkingdev

DDT开源:解耦扩散Transformer

近日,GitHub上开源了一个名为DDT(Decoupled Diffusion Transformer)的项目,该项目实现了一种结合Transformer和扩散模型的新型架构。该架构采用Encoder-Decoder设计,其中Decoder部分由扩散模型构成。初步实验表...

Read More
2025-05-05 talkingdev

谷歌Gemini 2.5 Pro AI直播通关《精灵宝可梦蓝》,展现游戏领域AI潜力

谷歌最新一代多模态AI模型Gemini 2.5 Pro在非官方测试中完成了一项里程碑式挑战——通过实时直播完整通关经典游戏《精灵宝可梦蓝》。这一突破性演示由开发者社区发起,展示了大型语言模型在复杂游戏环境中的决策能力和...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page