漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-13 talkingdev

论文:小成本实现语言模型部分窃取

据报道,使用公共API即可窃取闭源语言模型的部分内容,例如嵌入层。这项技术只需不到2000美元的预算即可实现。

Read More
2024-03-13 talkingdev

Transformer Debugger: 为小型语言模型提供自动可解释性技术支持

Transformer Debugger是一种工具,它通过将自动可解释性技术与稀疏自动编码器相结合,支持对小型语言模型的特定行为进行调查。

Read More
2024-03-12 talkingdev

微软AICI-实时控制语言模型的输出

人工智能控制界面(AICI)使您能够构建控制器,以实时约束和指导大型语言模型的输出。通过AICI,用户可以使用自己的约束条件或限制来约束模型的输出,同时还可以通过实时反馈来调整约束条件,从而实现更好的模型输出...

Read More
2024-03-12 talkingdev

Cohere For AI发布Command-R多语言模型

Cohere For AI发布了一个30B+参数模型,该模型在10种语言的推理、摘要和问答方面非常擅长。该模型名为Command-R,是自然语言处理领域的一项重大突破。Command-R模型可以在多语言环境下进行推理和答案提取,这对于跨...

Read More
2024-03-12 talkingdev

Covariant推出ChatGPT,为机器人构建LLM

Covariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...

Read More
2024-03-12 talkingdev

xAI的语言模型Grok将于本周开源

据Elon Musk在X上透露,xAI的语言模型Grok将在未来几天内开源。 Grok是xAI的一项重要技术,它基于深度学习技术,能够快速地处理自然语言,并在文本中找到有意义的信息。Grok已经在xAI内部使用了很长时间,现在将会对...

Read More
2024-03-11 talkingdev

突破GPT-4,四款新语言模型亮相

来自不同厂商的四款新模型正在挑战GPT-4长期以来的顶尖大型语言模型的地位,展示了能力和应用方面的不断进步,但它们都没有公开许可证或透明地公开其训练数据。

Read More
2024-03-11 talkingdev

大型语言模型中的优化算法metaheuristics引入,有效优化prompt学习

本文介绍了元启发式算法,这是一种强大的工具,可用于改善大型语言模型中的prompt学习。元启发式算法是一组多样化的超过100种离散优化方法,可以大大提高大型语言模型的效率和性能。

Read More
  1. Prev Page
  2. 43
  3. 44
  4. 45
  5. Next Page