漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-02 talkingdev

基于LiDAR技术的自动驾驶运动目标分割(MF-MOS)新模型开源

MF-MOS是一种新模型,可以更好地使用LiDAR技术检测自动驾驶中的运动目标。该模型独特地分离运动和语义信息,使用残差图进行运动捕捉,使用距离图像进行语义引导。该模型的发布将进一步推动自动驾驶技术的发展。

Read More
2024-02-02 talkingdev

AlphaGo中的MCTS搜索算法实现

Monte Carlo Tree Search (MCTS)是一种先进的搜索算法。它被用于AlphaGo中,研究人员现在正在努力将其与语言模型集成。MCTS的实现一直以来都非常棘手,但是Jax的出现使得它变得更为容易。现在,开发者们可以在GitHub...

Read More
2024-02-02 talkingdev

论文:文本为基础的图像修复技术发布

本文介绍了一个基于场景和手写文本的基准测试和两个数据集。利用原始、损坏和辅助图像,全局结构引导扩散模型(GSDM)利用文本结构有效恢复清晰文本。该技术在识别准确度和图像质量方面显示出显著的改进。

Read More
2024-02-02 talkingdev

Weaver-专注于讲故事的基础模型

Weaver是一系列专门用于讲述故事的模型。最大的模型(34B参数)在故事讲述基准测试中表现优于GPT-4。

Read More
2024-02-02 talkingdev

Llava 1.6发布,OCR、推理和世界知识得到改进

Llava是一种视觉语言模型,最新版本为1.6,经过改进后,其OCR、推理和世界知识等方面有了很大提升,甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型,以便更多人能够使用。

Read More
2024-02-02 talkingdev

微软利用激光技术解决LLM幻觉问题

1月份微软研究论坛上,Dipendra Misra提出了一种名为“Layer-Selective Rank Reduction(LASER)”的技术,通过用一个较小的近似矩阵替换权重矩阵,提高了大型语言模型(LLM)的准确性。

Read More
2024-02-02 talkingdev

Mistral CEO确认泄露的新开源AI模型接近GPT-4的性能

AI社区因HuggingFace和4chan分享的一个名为“miqu-1-70b”的泄漏大型语言模型而感到兴奋。该模型表现出能与OpenAI的GPT-4相媲美的性能,并与Mistral的Mixtral 8x7b有关。Mistral的CEO确认这是一位热情的客户泄露的,这...

Read More
2024-02-02 talkingdev

Web技术互通无阻,2024年Interop让你的浏览器更加智能

Interop项目旨在通过鼓励浏览器引擎团队深入研究各种Web技术及其在不同浏览器之间的兼容性,从而提高互操作性。该项目目前已经得到了Mozilla、Google、Microsoft等公司的支持。Interop项目的最终目标是将不同浏览器...

Read More
  1. Prev Page
  2. 748
  3. 749
  4. 750
  5. Next Page