漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-12 talkingdev

[开源]AlphaWrite:基于测试时计算扩展的智能写作系统(GitHub开源项目)

AlphaWrite是一项突破性的智能写作技术,它通过生成具有不同作者风格和主题的故事变体,并利用成对比较方法对内容质量进行排序,最终通过多代进化筛选出最优作品。这一创新不仅展示了人工智能在创意写作领域的潜力,...

Read More
2025-05-04 talkingdev

现代LLM采样技术入门指南:从原理到实践

一篇题为《Dummy's Guide to Modern LLM Sampling》的技术指南近期在开发者社区引发热议,该文章系统性地解读了现代大语言模型(LLM)中的采样技术。作为自然语言生成的核心组件,采样策略直接决定了文本输出的质量和...

Read More
2024-07-24 talkingdev

MINT-1T-拥有万亿令牌的多模态数据集

研究人员宣布了一个新的数据集,其中包含了一个拥有1万亿令牌的多模态数据集。该数据集包括图像、音频和文本数据,并可用于训练人工智能算法。通过使用这个数据集,研究人员可以更好地理解人类语言和视觉系统的工作...

Read More
2024-07-15 talkingdev

MARS-基于全新视觉语言模型改进文生图技术

MARS是一种全新的文本到图像(T2I)生成框架,它引入了语义视觉-语言集成专家(SemVIE)的特征。这种新型框架的主要目标是改进现有的T2I生成技术,使其能更好地理解和处理复杂的视觉语言任务。借助SemVIE,MARS能够实现...

Read More
2024-04-30 talkingdev

人工智能并非无用,但真的值得吗?

本文对人工智能和机器学习进行了深入剖析,认为尽管AI工具在某些任务中可能有所用处,但它们常常未能达到AI公司所作的宏大承诺。文章强调了AI实际应用案例,如编程辅助和语言生成,与行业叙事设定的过高期待之间的巨...

Read More
2024-02-08 talkingdev

移动端本地微型语言模型大有可为

近日,一项研究探讨了如何通过采用参数更少的微型语言模型,使得强大的语言模型更适合移动设备。研究人员发现,相较于传统的大型语言模型,微型语言模型在保证语言表达能力的前提下,可以极大地减少模型参数,从而显...

Read More
2024-01-08 talkingdev

开源项目RAG atouille用于检索管道的研发

Retrieval Augmented Generation(RAG)是一种将外部知识融入语言模型生成中的方法。RAGatouille库允许训练和研究最先进的RAG系统。它简化了研究人员的工作,使其能够更轻松地构建检索管道,并将其应用于语言生成领...

Read More
2023-12-18 talkingdev

论文:SwitchHead,更高效的Transformer模型

SwitchHead是使AI模型更高效的突破。它减少了Transformer的内存和计算需求,同时不会降低性能。SwitchHead是一种新颖的神经网络结构,可以在不丢失性能的情况下,将一个大型Transformer模型拆分为多个小型Transforme...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page