随着生成性人工智能(Gen AI)技术的迅速发展,越来越多的研究开始关注其对高技能工作的影响,特别是在软件开发领域。最近的一项实验研究对软件开发者在使用LLM、agent及相关技术时的工作效率和创造力进行了深入分析...
Read MoreMantle公司采用了Gemini 1.0 Pro LLM,并设置了一个百万token窗口,将原型项目转换为生产就绪的代码库,通过处理样板代码和重复模式,从而减少了工作量。这种方法利用了大量上下文和迭代代码生成,为开发团队节省了...
Read MoreMistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练,展现出了强大的多语言和英语处理能力。值得一提的是,Nemo 12B还支持128k的上下文。这种强大的性能,无疑...
Read More对微软的GraphRAG论文的分析揭示,像Neo4j这样的知识图谱在RAG应用的上下文检索中,可能并不会明显超过FAISS。尽管没有索引的Neo4j可以获得更高的答案相关性,但是边际收益可能无法证明投资的价值,考虑到ROI的限制...
Read MoreSFPNet是一种新方法,旨在实现对不同类型的LiDAR技术的泛化。该方法采用稀疏焦点调制技术,而非传统的窗口注意力机制,从而实现了对多级上下文的提取和动态聚合。这一全新的处理方式,使得SFPNet在LiDAR语义分割领域...
Read MoreLookback Lens是一个直接的模型,用于检测大型语言模型中的上下文幻觉。它通过在预测过程中引入更多的上下文信息,来解决大型语言模型(LLM)在生成文本时可能出现的幻觉问题。这种新的方法旨在提高模型预测的准确性...
Read More最近,一种新型的循环神经网络(RNN)变体在多项任务中的表现超过了Mamba。这种新型的RNN变体的重要特点是其更新函数本身就是一个机器学习(ML)模型。这使得它可以处理长上下文和在上下文中进行学习。在现今的机器...
Read MoreScoped Propagators是一种新的C++20功能,可以提高应用程序代码的可读性和可维护性。它是一个使用RAII(Resource Acquisition Is Initialization,资源获取即初始化)技术的技巧,可以自动向函数调用链中的所有函数...
Read More苹果正在对其人工智能(AI)进行细分处理,区分出'上下文'和'世界'模型。其中,像ChatGPT这样的'世界'模型,被用于处理开放式查询,但没有个人上下文。OpenAI的地位并不稳固,因为在大语言模型(LLMs)中缺乏防御壁...
Read MorePE-Rank是一种新的段落排名方法,通过使用单一的段落嵌入来进行上下文压缩,从而提高了效率。段落排名在许多技术领域都有重要的应用,如信息检索、机器翻译和自然语言处理等。传统的段落排名方法往往需要大量的计算...
Read More