漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-16 talkingdev

SWE-Factory开源基于LLM多智能体的自动解决管道

SWE-Factory项目近日发布了一套自动化训练与评估管道,专门用于GitHub问题解决任务。该系统的核心创新在于采用了基于大语言模型(LLM)的多智能体系统架构,通过模拟人类开发者的协作模式,实现了软件开发问题的智能...

Read More
2025-06-16 talkingdev

[论文推荐]自适应性语言模型突破:新型训练框架实现自我迭代优化

一项突破性研究提出让大语言模型通过生成"自我编辑指令"实现持续性参数更新的训练框架。该技术通过监督微调使模型自主产生训练材料,在较小参数量下性能超越GPT-4.1,为解决AI领域的"数据墙"瓶颈提供了新思路。研究...

Read More
2025-06-12 talkingdev

解析Sam Altman《温和奇点》愿景:数字超级智能临近下的乐观宣言

OpenAI首席执行官Sam Altman近期发表题为《温和奇点》的专题文章,系统阐述了人类即将构建数字超级智能(Digital Superintelligence)的技术前景与社会影响。该文通过逐段解构发现,Altman试图传递一种审慎乐观的技...

Read More
2025-06-09 talkingdev

微软推出GUI-Actor:AI代理无需坐标即可操作屏幕界面

微软研究院最新提出的GUI-Actor技术,彻底改变了AI代理与图形用户界面(GUI)的交互方式。这项突破性技术摒弃了传统依赖像素坐标预测的方法,转而采用注意力机制直接解析屏幕截图内容,使AI能够像人类一样'理解'界面...

Read More
2025-06-04 talkingdev

[开源]JigsawStack推出开源深度研究工具(GitHub仓库)

JigsawStack近日推出了一款开源深度研究工具框架,该框架通过协调大型语言模型(LLMs)、递归网络搜索和结构化推理,能够生成通常需要人类数小时甚至数天才能完成的研究报告。该工具提供了对研究深度、广度、模型选择...

Read More
2025-05-22 talkingdev

[论文推荐]慢思考提升大语言模型的置信度校准能力

最新研究表明,通过延长思维链推理过程(Extended chain-of-thought reasoning),大型语言模型(LLMs)能够显著提升其置信度校准能力。这项发表在arXiv预印本平台的研究(编号2505.14489v1)揭示了传统即时响应模式...

Read More
2025-05-22 talkingdev

FutureHouse新型AI系统成功发现治疗主要致盲疾病的新疗法

FutureHouse通过将专业文献搜索代理与数据分析代理结合在持续的实验循环中,显著加速了医学发现进程。该系统能够从文献综述中自主生成假设,提出供人类执行的实验方案,并分析实验数据以指导下一轮研究。在这一过程...

Read More
2025-05-22 talkingdev

Descope推出Agentic Identity Hub,助力AI代理安全连接应用与MCP服务器

随着AI代理、API和合作伙伴应用的普及,传统应用已不再仅限于人类用户。Descope最新推出的Agentic Identity Hub旨在解决AI代理与应用程序及远程MCP服务器之间的安全连接问题。通过简单的几行代码,开发者即可使其API...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page