模型的相关内容 - 漫话开发者

2024-04-11 talkingdev

论文：DreamView引领3D创作，文本描述转立体模型

DreamView近期推出了一项革命性的技术，能够根据文本描述生成3D对象，并支持从多个视角进行详细定制，同时确保物体整体的一致性。这一技术突破为3D设计师和开发者提供了前所未有的便利，使得从概念到实现的过程更加...

2024-04-11 talkingdev

谷歌在其Vertex AI平台上公开预览了最新一代生成型AI模型Gemini 1.5 Pro。该模型提供了高达100万个标记的大容量上下文窗口，这使得它能够处理更复杂的文本生成任务，同时保持高效的计算性能。此举进一步展示了谷歌在...

2024-04-11 talkingdev

谷歌凭借其在人工智能领域的深度投资，不仅帮助客户训练和部署前沿的语言模型，更使得公司站在了AI平台变革的前沿。本文深入探讨了谷歌的基础设施如何助力企业转型，以及这对谷歌竞争力的意义。尽管谷歌可能需要转变...

2024-04-10 talkingdev

苹果公司开发了一款名为Ferret-UI的多模态大型语言模型（LLM），该模型具备理解移动设备用户界面的能力，有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...

2024-04-10 talkingdev

Longcontext Alpaca训练技术最近取得了重大突破，通过在H100硬件上使用新的梯度累积卸载技术，成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效，显著提高了计算资源的利...

2024-04-10 talkingdev

Visual Autoregressive Models是一个新的GitHub项目，它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开，但目前该项目已经引起了技...

2024-04-10 talkingdev

近日，开发者社区GitHub上出现了一项名为SqueezeAttention的新技术，该技术针对大型语言模型（LLMs）的键值缓存进行了优化。通过SqueezeAttention，内存使用量能够显著降低30%至70%，同时吞吐量也得到了翻倍提升。这...

2024-04-10 talkingdev

近日，GitHub上发布了一项新的基准测试工具——化学工作台（Chemistry Bench），旨在评估大型语言模型在处理化学问题方面的能力。该工具与Big-Bench兼容，能够对语言模型的科学素养进行有效衡量。化学工作台通过一系列...