漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-03 talkingdev

论文:随机颜色擦除提升计算机视觉模型鲁棒性

研究人员开发了一种名为随机颜色擦除的新学习策略,旨在解决计算机视觉中的颜色偏差问题。该方法通过从训练数据中选择性地移除颜色信息,平衡颜色与其他特征的重要性,从而提高模型在复杂场景中的表现,如广域监控和...

Read More
2024-06-03 talkingdev

OpenAI 重启机器人研究团队,探索多模态机器人模型

在停摆三年后,OpenAI 宣布重启其机器人研究团队。此举旨在开发多模态机器人模型,并改进核心的人工智能模型。OpenAI 的这一决定标志着其在机器人领域的再度发力,旨在通过多模态模型结合视觉、语音和动作等多种感知...

Read More
2024-06-03 talkingdev

Mozilla开发浏览器内运行的图片自动生成Alt文本模型

Mozilla公司最近成功训练了一款可以在浏览器内运行,并自动为网页图片生成替代文本(Alt文本)的模型。这一创新技术旨在提高网页的无障碍性,使视力障碍用户能够更好地理解网页内容。通过在本地运行模型,Mozilla不...

Read More
2024-06-03 talkingdev

一年构建大型语言模型(LLMs)的洞见与心得

随着人工智能技术的飞速发展,利用AI构建产品和系统变得前所未有的便捷。然而,要超越简单的演示,打造真正有效的产品与系统,仍存在诸多挑战。本文通过作者一年来使用大型语言模型(LLMs)构建应用程序的经验,为读...

Read More
2024-06-03 talkingdev

揭秘AI破解者:对话ChatGPT及其他领先LLMs的越狱高手

Pliny the Prompter在OpenAI最新的基础模型GPT-4o发布后仅数小时就公布了破解方案。该破解允许用户使模型输出明确的受版权保护的歌词、制造禁令物品的说明、攻击策略计划以及基于X光的医疗建议。Pliny已在大约9个月...

Read More
2024-06-02 talkingdev

一年来与LLMs一起构建的经验教训

自去年推出以来,语言模型(LLMs)已成为人工智能领域的热点。一年来,我们使用LLMs构建了许多项目,并从中获得了许多宝贵的经验教训。首先,LLMs需要大量的数据来进行训练,只有这样才能产生准确的结果。其次,LLMs...

Read More
2024-05-31 talkingdev

论文:Yuan 2.0-M32,具备注意力路由的MOE专家混合模型

Yuan 2.0-M32是一款具备40亿参数的专家混合模型,其中任意时刻仅有3.7亿参数处于激活状态。尽管其计算需求仅为Llama 3 70B的1/19,但其性能却接近后者。该模型在2万亿个token上进行了训练,展现出了令人惊讶的强大性...

Read More
2024-05-31 talkingdev

1bit-LLMs:AI能效问题的创新解决方案

随着大型语言模型性能的提升,其对能源和计算能力的渴求也随之增加。为降低成本,提高处理速度,同时减少对环境的影响,模型需要实现更小型化。研究人员目前采用一种名为量化的技术,通过减少模型参数的精度来压缩网...

Read More
  1. Prev Page
  2. 244
  3. 245
  4. 246
  5. Next Page