漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-25 talkingdev

[开源] Plwm – 用Prolog编写的X11窗口管理器

近日,GitHub上出现了一个名为Plwm的开源项目,该项目使用Prolog语言编写了一个X11窗口管理器。Prolog作为一种逻辑编程语言,通常用于人工智能和自然语言处理领域,而此次被用于开发窗口管理器,展示了其在系统编程...

Read More
2025-05-23 talkingdev

[论文推荐]字节跳动发布开源多模态基础模型BAGEL,支持跨模态理解与生成

字节跳动最新发布的开源多模态基础模型BAGEL在技术领域引发广泛关注。该模型原生支持多模态理解与生成任务,在开源统一模型中表现优异。BAGEL展现出先进的跨模态推理能力,包括图像编辑、3D场景操作和世界导航等复杂...

Read More
2025-05-23 talkingdev

开源Web Agent框架:用自然语言描述网页结构

Notte Labs近日在GitHub上开源了一款名为Notte的Web Agent框架,该框架旨在构建能够浏览并与网站交互的AI智能体。其核心创新在于引入了一个"感知层"(perception layer),该技术能够将网页内容转化为结构化的自然语...

Read More
2025-05-22 talkingdev

谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

Read More
2025-05-22 talkingdev

构建具备自我优化能力的智能图像生成器

最新研究表明,大型语言模型在自然语言处理方面展现出强大的视觉缺陷推理能力,但在将这些高层次洞察转化为精确的像素级操作时仍面临挑战。这些模型在受限于明确、界定清晰的维度时表现优异,但当需要平衡抽象美学判...

Read More
2025-05-19 talkingdev

[开源]GitHub Copilot编码助手进入公开预览阶段

GitHub官方博客宣布,其AI编程助手Copilot的编码代理功能(Coding Agent)正式开放公开预览。该功能允许开发者将技术债务和积压问题委托给AI代理处理,从而专注于更具创造性和高影响力的工作。据GitHub透露,Copilot...

Read More
2025-05-18 talkingdev

[开源] 使用SBERT建模《伏尼契手稿》结构:NLP技术探索中世纪未解之谜

一位开发者利用自然语言处理(NLP)技术对神秘的《伏尼契手稿》进行了结构性分析。该手稿是15世纪以未知文字书写的古籍,至今未被破译,其真实性也饱受争议。项目采用SBERT(Sentence-BERT)模型生成词根嵌入,结合K...

Read More
2025-05-16 talkingdev

OpenAI发布Codex研究预览:AI编程助手的新里程碑

OpenAI近日发布了其AI编程助手Codex的研究预览版,这一突破性技术基于GPT-3模型,专门针对代码生成和编程任务进行了优化。Codex能够理解自然语言指令并将其转化为功能性代码,支持包括Python、JavaScript、Go等在内...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page