DoctorGPT,这款领先的语言模型(LLM),已经能够通过美国医疗执照考试。它的特点是可以离线工作,跨平台运行,且能保护用户的健康数据私密性。这款开源的AI医生,将为医疗行业带来革命性的改变,使得医疗服务更具普...
Read MoreIBM与Hugging Face正在向公众发布IBM的地理空间基础模型,该模型使用NASA的卫星数据进行构建。这个模型是IBM与NASA的合作成果,旨在推动AI在气候科学和地球研究中的作用,解决处理大型环境数据集的挑战。该模型已经...
Read More本文探讨了一个微型模型的训练动态,并反向工程了它找到的解决方案。这为我们揭示了一个令人兴奋的新兴领域——机械可解释性。机器学习模型在工作时,是通过记忆数据还是通过泛化理解进行推理?这是一个长期存在且至关...
Read MoreMirage是一个用于生成3D场景的平台,被游戏开发者广泛使用以加快开发过程。Mirage团队一直在内部致力于改进各种3D生成方法。此次开源推动旨在利用社区的力量来优化其模型。Mirage的开源对于游戏开发者和3D艺术家来说...
Read More当前的3D物体检测器常常会误解数据,使其关注点距离目标物体较远。为了解决这个问题,一种名为“3D顶点相对位置编码”的新方法已经被开发出来。这种新方法可以引导检测器的注意力集中于靠近目标物体的点。这不仅提高了...
Read MoreAnthropic近日发布了更新版本的快速、经济的文本生成模型Claude Instant。此模型能生成更长、结构更严谨的回复,更好地遵循格式指示,并在引用提取、多语种能力和问答方面表现出改善。Claude Instant已通过API可供使...
Read More该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...
Read MoreSweep是一个开源的AI初级开发者,可以将问题转化为PR。当你在GitHub上发布问题,比如'为windows使用操作系统不可知的临时目录',Sweep就能写出一个拉取请求,将所有的'/tmp'替换为'tempfile.gettempdir()'。通过这种...
Read More稳定性AI公司近日公开发布了一款名为StableCode的新型开源大语言模型。该模型的主要设计目标是助力用户生成编程语言代码。StableCode的发布旨在改进和简化编程语言代码的生成过程,从而进一步优化编程体验,提高代码...
Read MoreSoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...
Read More