漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-28 talkingdev

Llama推理模型在GitHub Gist上的最新进展

近日,GitHub Gist上发布了一个关于Llama推理模型的最小化工作复现版本。该模型最初由OpenAI提出,并由DeepSeek发布。该模型通过数学问题的格式和正确性奖励进行训练,展示了在长时间训练后出现的“顿悟”时刻。这一进...

Read More
2025-01-28 talkingdev

CoT推理助力自回归图像生成技术突破

近日,一项关于CoT(Chain-of-Thought)推理在自回归图像生成领域的研究项目引发了广泛关注。该项目通过探索CoT推理的潜力,旨在提升自回归图像生成模型的表现。自回归模型在图像生成任务中通常依赖于逐步预测像素值...

Read More
2025-01-28 talkingdev

1Prompt1Story:无需训练的文本到图像生成新方法

1Prompt1Story是一种无需训练的文本到图像生成方法,通过单一串联提示实现一致的图像生成。该方法的核心在于将多个提示信息串联成一个整体,从而在生成过程中保持一致性。与传统的训练依赖型方法不同,1Prompt1Story...

Read More
2025-01-28 talkingdev

论文:基础模型参数高效微调技术综述

本文综述了基础模型的参数高效微调技术,深入探讨了在保持多样化任务性能的同时,如何最小化计算成本的方法。随着基础模型(如LLM)的广泛应用,参数高效微调技术(如LoRA、RAG等)成为研究热点。这些技术通过减少需...

Read More
2025-01-28 talkingdev

GSTAR方法:动态网格重建与3D点追踪的新突破

近日,一项名为GSTAR的技术在动态网格重建和3D点追踪领域取得了显著进展。该方法通过多视角摄像机的精确校准,能够高效地重建动态网格并追踪3D空间中的每一个点。尽管目前仍需依赖多视角摄像机的支持,但这一技术为...

Read More
2025-01-28 talkingdev

Qwen团队推出1M上下文模型,性能强劲且本地化

Qwen团队近日发布了其最新的1M上下文模型,展示了在训练过程中逐步扩展上下文能力的技术进展。该模型不仅性能强劲,还支持本地化运行,显著提升了处理长文本任务的效率。此外,Qwen团队还发布了基于vLLM的推理框架,...

Read More
2025-01-28 talkingdev

AI素养工具包:助力企业全面提升GenAI能力

根据微软的工作趋势指数报告,60%的人表示他们目前缺乏完成工作所需的技能。这一差距凸显了领导者迫切需要尽快在团队中构建AI素养。通过这一资源包,企业可以为员工提供所需的技能,帮助他们在AI驱动的世界中脱颖而...

Read More
2025-01-28 talkingdev

微软基于PostgreSQL打造开源文档数据库,并推荐使用FerretDB作为前端

对于希望在文档数据库领域进行创新开发的开发者来说,他们现在有了更多的选择。微软最近推出了一个建立在关系型PostgreSQL后端的文档数据库平台,并建议用户通过在该平台上实施FerretDB解决方案来开始他们的项目。微...

Read More
  1. Prev Page
  2. 84
  3. 85
  4. 86
  5. Next Page