X的相关内容 - 漫话开发者

2024-05-20 talkingdev

论文：Meta发布全新融合多模型Chameleon，性能超越多种替代模型

Meta公司近日宣布发布一种名为Chameleon的全新模型，该模型可以像GPT-4o那样同时操作图像和文本。相比于许多其他的替代模型，Chameleon展现出了更好的性能。据悉，Meta团队在内部模型上已经远远超越了这项工作。该模...

2024-05-20 talkingdev

Unitree近期发布了其新款G1人形机器人的初步信息，这款机器人的售价高达16,000美元。G1配备了3D激光雷达传感器，深度相机，三指夹具以及一个9000mAh的电池组。据短片演示，该机器人甚至能够从猛烈的踢打中恢复过来。...

2024-05-20 talkingdev

xAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型，拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点，这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...

2024-05-17 talkingdev

在技术领域，一种名为MasterWeaver的新方法被提出，以提高个性化文本到图像生成模型的性能。这种技术的出现，无疑为AI领域的图像生成技术开辟了新的可能性，使得文本到图像的转换过程更为精确和个性化。MasterWeaver...

2024-05-17 talkingdev

Xmodel-VLM是一种针对消费级GPU服务器优化的视觉语言模型。为解决高昂的服务成本限制了大规模多模态系统的应用，这个10亿规模的模型采用了LLaVA范式进行模态对齐。这是一种新的方法，它优化了视觉和语言之间的协同工...

2024-05-16 talkingdev

教育者们正在从语法层面转向更高级的技能。在过去，编程教育主要侧重于语法和基础编程技巧。然而，随着AI副驾驶的出现，这一趋势正在发生变化。AI副驾驶不仅能够帮助程序员快速编写代码，还可以帮助他们理解复杂的编...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...

2024-05-16 talkingdev

项目IDX是一个以AI为中心的，基于浏览器的开发环境，该项目于8月份以邀请制的形式启动。已有超过10万开发者尝试了该项服务，并现已进入公开测试阶段。Google已经将Google地图平台的集成添加到了这个IDE中，并与Chrom...

2024-05-15 talkingdev

深度学习中的SiLU和SoftMax函数在许多任务中都是必不可少的，但它们的计算成本很高。为了改进这一点，来自华盛顿大学的研究人员提出了两个新的指数函数，可以将它们的速度提高2倍，同时完全保持准确性。这些函数分别...

2024-05-15 talkingdev

近日，Google发布了新的轻量级模型Gemini Flash。此模型具有多模态推理和高达一百万个符号的长上下文窗口。Google利用其先进的技术，使Gemini Flash在处理大量数据时保持了高效与精确。这种新型的轻量级模型将有助于...