漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-04-10 talkingdev

谷歌推出Code Assist,向GitHub Copilot发起最新挑战

谷歌近日推出了一款面向企业用户的人工智能代码补全和辅助工具——Gemini Code Assist。该工具曾以已停止的Duet AI品牌提供服务,并在2023年底全面开放使用。Code Assist不仅是一次品牌重塑,也是一次重大更新。它采用...

Read More
2024-04-02 talkingdev

苹果研究团队推出ReALM系统,性能超越GPT-4

苹果公司的人工智能研究人员开发了一种新型系统ReALM,该系统通过考虑屏幕上的内容、对话中的实体以及背景信息,增强了Siri理解上下文的能力。在基准测试中,ReALM系统的性能超过了ChatGPT 4.0。这一突破性的技术进...

Read More
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-25 talkingdev

哈希网格辅助上下文框架实现3D高斯数据75倍压缩

本项目介绍了哈希网格辅助上下文(HAC)框架,该框架实现了3D高斯数据(3DGS)的压缩,压缩比超过75倍,超越了当前的压缩标准。通过采用这种创新技术,3D高斯数据的存储和传输效率将得到显著提升,对于云计算、游戏...

Read More
2024-03-19 talkingdev

新兴AI资源网站More Useful Things揭示AI生成提示的奇特效能

近期上线的伴随网站More Useful Things为公众提供了大量免费的人工智能与机器学习资源。该网站通过一系列实验展示了AI生成的提示,例如富有想象力的场景构造,在解决数学问题等任务中如何超越人工编写的提示。这些实...

Read More
2024-03-19 talkingdev

论文:自注意力机制下的下一个标记预测技术揭秘

下一个标记预测作为一个简单的目标,却能引发复杂的行为模式。最新的研究发现,仅通过一个自注意力层并结合梯度下降法训练,就能将问题分解为困难的检索和柔和的组合,这一过程不仅实现了上下文学习,还显著提升了模...

Read More
2024-03-18 talkingdev

OpenAI意外泄露下一代ChatGPT升级版GPT-4.5 Turbo?

近日,OpenAI疑似意外发布了一篇博客文章,该文章被Bing和DuckDuckGo索引后迅速被撤下。文章似乎是关于GPT-4.5 Turbo的公告,这是一个新的模型,其速度、准确性和可扩展性均超越了GPT-4 Turbo。缓存的描述中提到了20...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page