漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-16 talkingdev

AI医生DoctorGPT开源,能通过美国医疗执照考试

DoctorGPT,这款领先的语言模型(LLM),已经能够通过美国医疗执照考试。它的特点是可以离线工作,跨平台运行,且能保护用户的健康数据私密性。这款开源的AI医生,将为医疗行业带来革命性的改变,使得医疗服务更具普...

Read More
2023-08-16 talkingdev

IBM与NASA联手开源Hugging Face平台上最大的地理空间AI基础模型

IBM与Hugging Face正在向公众发布IBM的地理空间基础模型,该模型使用NASA的卫星数据进行构建。这个模型是IBM与NASA的合作成果,旨在推动AI在气候科学和地球研究中的作用,解决处理大型环境数据集的挑战。该模型已经...

Read More
2023-08-14 talkingdev

机器学习模型是记忆还是泛化?揭秘模型训练动态

本文探讨了一个微型模型的训练动态,并反向工程了它找到的解决方案。这为我们揭示了一个令人兴奋的新兴领域——机械可解释性。机器学习模型在工作时,是通过记忆数据还是通过泛化理解进行推理?这是一个长期存在且至关...

Read More
2023-08-14 talkingdev

Mirage,顶尖的文本到3D转化技术开源

Mirage是一个用于生成3D场景的平台,被游戏开发者广泛使用以加快开发过程。Mirage团队一直在内部致力于改进各种3D生成方法。此次开源推动旨在利用社区的力量来优化其模型。Mirage的开源对于游戏开发者和3D艺术家来说...

Read More
2023-08-11 talkingdev

论文:利用DETR改进3D物体检测的新方法

当前的3D物体检测器常常会误解数据,使其关注点距离目标物体较远。为了解决这个问题,一种名为“3D顶点相对位置编码”的新方法已经被开发出来。这种新方法可以引导检测器的注意力集中于靠近目标物体的点。这不仅提高了...

Read More
2023-08-10 talkingdev

Anthropic推出改进版入门级LLM模型:Claude Instant

Anthropic近日发布了更新版本的快速、经济的文本生成模型Claude Instant。此模型能生成更长、结构更严谨的回复,更好地遵循格式指示,并在引用提取、多语种能力和问答方面表现出改善。Claude Instant已通过API可供使...

Read More
2023-08-09 talkingdev

评估大型语言模型作为代理的能力:AgentBench工具

该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...

Read More
2023-08-09 talkingdev

Sweep,开源AI助理开发者,实现问题转化为PR

Sweep是一个开源的AI初级开发者,可以将问题转化为PR。当你在GitHub上发布问题,比如'为windows使用操作系统不可知的临时目录',Sweep就能写出一个拉取请求,将所有的'/tmp'替换为'tempfile.gettempdir()'。通过这种...

Read More
2023-08-09 talkingdev

StableAI正式发布首款开源大语言模型StableCode

稳定性AI公司近日公开发布了一款名为StableCode的新型开源大语言模型。该模型的主要设计目标是助力用户生成编程语言代码。StableCode的发布旨在改进和简化编程语言代码的生成过程,从而进一步优化编程体验,提高代码...

Read More
2023-08-04 talkingdev

论文:SoftMoE,一种改进的稀疏混合专家模型,低成本提高模型容量

SoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page