X的相关内容 - 漫话开发者

2024-06-27 talkingdev

基于LLM的Agent未来，如何扩展其能力范围

本篇文章分享了两种关键方法，帮助Agent从实验阶段走向真实世界：长期规划和系统级的鲁棒性。这些方法引入了为代理人制定高阶计划的能力，同时允许在剧情中途进行适应，以及采用系统方法智能地协调提供更高精度和性...

2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日，一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器（Trajectory Diffusion Transformer）和多视图...

2024-06-27 talkingdev

论文：DeepMind通过联合样本选择进行数据策划，进一步加速多模态学习

在预训练中，如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本，仍然能匹配各种任务的最新技术。在这个过程中，他们采用了一种名为“联合样...

2024-06-27 talkingdev

Surface Pro X引领Windows on Arm性能飞跃

自2019年微软发布Surface Pro X以来，基于Arm架构的Windows操作系统体验取得了显著提升。Surface Pro X搭载的定制版高通SQ1处理器，不仅在能效上优于传统x86架构处理器，更在兼容性和性能上做了大量优化工作。通过持...

2024-06-26 talkingdev

EvalAlign：一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同，EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是，EvalAlign不...

2024-06-26 talkingdev

Etched筹集1.2亿美元A轮融资，为Transformer生产AI芯片

Etched近日宣布完成由Primary Venture Partners和Positive Sum Ventures主导的1.2亿美元融资，天使投资人包含Peter Thiel，Stanley Druckenmiller和David Siegel等。Etched正在与TSMC的新兴业务集团直接合作，以在其...

2024-06-25 talkingdev

从dotenv到dotenvx - 更好的配置文件管理

dotenv是一种在Node.js和JavaScript应用程序中处理环境变量的流行方法，但它有一些限制。dotenvx是一个新的工具，可以解决dotenv存在的问题，并提供更好的配置文件管理。dotenvx可以处理多个环境文件，可以将它们混...

2024-06-25 talkingdev

AI领域的职业机遇

知名开发者Shawn“swyx”Wang谈到了传统软件开发者转型AI的隐藏机遇。他特别指出，基于当前工具的构建，以及使用AI进行总结等，都是开发者可以考虑的方向。他认为，AI并非一个完全独立的领域，对于传统软件开发者来说...

2024-06-25 talkingdev

ParaLLM ：Mac上基于MLX实现每秒1300个Token推理

在MLX中实施批量并行KV缓存，导致合成数据生成和模型完成的推理时间显著提速。这种新的技术实现方式大大加快了处理速度，从而在Mac上每秒可以处理1300个Token。这一突破性的技术进步，不仅可以提高处理效率，同时也...

2024-06-25 talkingdev

混合注意力MoA在大型语言模型中的应用

混合注意力（MoA）方法在大型语言模型中优化稀疏注意力，通过为不同的头部和层定制独特的稀疏注意力配置。该方法通过改变稀疏注意力的配置，使模型可以更有效地处理复杂的语言模型，从而提高模型的性能和效率。