漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-24 talkingdev

自我训练调查:机器学习新方向解析

半监督和自我监督学习是机器学习模型生成训练信号的地方。这与标准的监督、无监督和强化学习有所不同。目标函数通常是特定于数据的(例如,掩盖单词或旋转图像)。本研究深入探讨了在这个领域使用的常见技术和存在的...

Read More
2023-08-23 talkingdev

聊天机器人GPT-3.5-turbo现可进行微调操作

您现在可以在自定义数据上微调gpt-3.5-turbo模型了。微调后的模型完全属于您,且不会利用您的数据训练其他模型。这种方法可以大大降低成本、提升控制性,并改善整体性能。此外,GPT-4的微调功能也将在今年秋季推出。

Read More
2023-08-16 talkingdev

AI与内存壁垒:LLaMA.cpp的崛起之路

LLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook能够以稍慢于A100的速度运行最先进的模型呢?答案在于,当你一次只处理一个批次,一个标记的时候,内存带宽就成了瓶颈。而M2的内存带宽与A100的之间的差距...

Read More
2023-08-16 talkingdev

Intuitive Machines表示已经准备好飞往月球

Intuitive Machines准备将其Nova-C着陆器送上月球。该公司正在与其他美国公司竞争由NASA资助的任务,以将科学实验和其他有效载荷送到月球表面。Intuitive Machines已经在SpaceX的猎鹰9号火箭上预订了一次飞行,预计...

Read More
2023-08-14 talkingdev

机器学习模型是记忆还是泛化?揭秘模型训练动态

本文探讨了一个微型模型的训练动态,并反向工程了它找到的解决方案。这为我们揭示了一个令人兴奋的新兴领域——机械可解释性。机器学习模型在工作时,是通过记忆数据还是通过泛化理解进行推理?这是一个长期存在且至关...

Read More
2023-08-11 talkingdev

引领科技潮流,impel-Mac智能AI伴侣正式亮相

「impel」是一款专为Mac设计的全天候AI伴侣。这款产品理解您屏幕上的内容,无需任何提示,就能自动提供建议、信息和行动。它能够理解和解析用户在屏幕上进行的所有活动,并根据上下文,无需用户主动询问,就能主动提...

Read More
2023-08-07 talkingdev

论文:利用LLM技术提升婴儿级语言模型的性能

最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...

Read More
2023-07-26 talkingdev

Arc浏览器现已面向所有用户提供下载

Arc终于放弃了等候名单。该浏览器现在可供Mac和iOS用户下载。它具有记笔记、制作协作画板、重新设计网页等工具。尽管与其他基于Chromium的浏览器一样,该浏览器有一些性能问题,但在过去几个月中一直非常稳定。

Read More
2023-07-21 talkingdev

Ollama:在macOS上运行和打包大型语言模型

近日,GitHub上出现了一个名为Ollama的新项目,它专为在macOS系统上运行和打包大型语言模型而设计。Ollama项目为那些在macOS上使用大型语言模型的开发者提供了一种简便的解决方案,帮助他们更轻松地将这些模型集成到...

Read More
2023-07-12 talkingdev

TIM新方法提升机器翻译性能,表现超过现有技术

研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page