机器学习的相关内容 - 漫话开发者

2024-04-30 talkingdev

GitHub发布新项目Copilot Workspace，让语言模型帮助完成功能和修复错误

GitHub近日宣布启动一个新项目Copilot Workspace，其主要目标是允许语言模型以较为自主的方式完成特性开发和错误修复。该项目将为开发者提供更多便利，提高开发效率，同时也为人工智能在软件开发领域的应用开启了新...

2024-04-29 talkingdev

近日，Meta推出了全新的Llama模型预训练框架——Torchtitan。该框架是完全使用PyTorch编写的，具有高度的灵活性和易用性。对于广大的PyTorch用户和开发者来说，这是一个利好消息。Meta是全球最大的社交网络公司，其在...

2024-04-29 talkingdev

本文展示了链式思考（CoT）可以通过'...'代币进行混淆。这需要训练模型，但表明可能无法解读CoT步骤，模型可以隐藏思考过程。链式思考是一种新兴的人工智能技术，通过模拟人类思考过程，提高机器学习模型的决策质量...

2024-04-28 talkingdev

MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM)，完全使用Python/Jax编写，目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开，充分展示了其强大的功能和优秀的性能。MaxTex...

2024-04-28 talkingdev

苹果公司近日发布了OpenELM，这是一套包含八种开源语言模型（LLM）的系列产品。这些模型可以高效地在单一设备上运行，用于文本生成任务，其参数大小范围从2.7亿到30亿。OpenELM的发布，标志着苹果在人工智能与机器学...

2024-04-27 talkingdev

加权CPS（WCPS）是符合预测系统的一个扩展，专门用于适应数据环境的变化，特别是协变量的转变。协变量在统计学中是一种可以影响到研究结果的外部变量，而WCPS通过自适应调整，能更好地应对这种变化。这种扩展方法在...

2024-04-22 talkingdev

在人工智能领域，神经网络是一种非常重要的模型。为了提高神经网络的性能，研究人员需要使用高效的工具来构建、编辑和可视化这些网络。近日，谷歌发布了名为Penzai的JAX研究工具包，旨在帮助研究人员更轻松地完成这...

2024-04-16 talkingdev

研究人员近日开发了一种名为Mixture of Prefix Prompt Experts（MPPE）的新技术，旨在增强零样本学习模型中的对话状态跟踪能力。该方法通过转移知识至未见领域，而无需新的数据集注释。这一新技术将有助于提升机器对...