最新发表在arXiv的研究论文揭示,Anthropic公司开发的Claude 3.5 Sonnet大型语言模型在说服力测试中展现出超越人类的表现。在严格控制的人机对比实验中,当双方都试图影响参与者回答测验问题时,Claude模型取得了7.6...
Read More一位开发者利用自然语言处理(NLP)技术对神秘的《伏尼契手稿》进行了结构性分析。该手稿是15世纪以未知文字书写的古籍,至今未被破译,其真实性也饱受争议。项目采用SBERT(Sentence-BERT)模型生成词根嵌入,结合K...
Read MoreOpenAI近日发布了其AI编程助手Codex的研究预览版,这一突破性技术基于GPT-3模型,专门针对代码生成和编程任务进行了优化。Codex能够理解自然语言指令并将其转化为功能性代码,支持包括Python、JavaScript、Go等在内...
Read More近日,开发者dipampaul17在GitHub上发布了KVSplit项目,该项目通过差异化精度的KV缓存量化技术,在苹果芯片(M1/M2/M3/M4)上实现了更长上下文的LLM推理。研究发现,LLM推理中的KV缓存中,键(Keys)和值(Values)...
Read MoreHeyGen公司最新推出的Avatar IV标志着AI数字人技术进入新纪元。该模型采用神经音频-表情引擎技术,通过解析语音的声调、节奏和情感等多维特征,仅需单张静态图像即可驱动生成高度逼真的面部微表情动画。这项突破性技...
Read MoreNous Research近期推出的Psyche网络是一个基于Solana区块链的分布式训练系统,该系统允许拥有兼容硬件的用户自愿贡献其GPU资源用于AI模型训练。该项目的首个计划"Consilience"旨在利用20万亿个token训练一个拥有400...
Read MoreBLIP3-o作为一种新型的扩散Transformer架构,通过序列预训练方法实现了技术突破,并在多模态基准测试中取得了当前最优异的成绩。该研究不仅发布了完整的代码和权重文件,还附带了一个包含6万条指令的微调数据集,为...
Read MoreOpenThinkIMG项目为视觉语言模型(VLMs)提供了革命性的视觉工具调用框架,其核心技术突破体现在三个方面:首先,通过动态推理机制实现多工具链式调用,使AI能根据图像内容自主选择处理工具;其次,创新的V-ToolRL强化...
Read More