漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-09 talkingdev

OpenAI确认GPT-2-Chatbot为其新型AI模型

近期在LMSYS舞台上出现的gpt-2-chatbot已被确认为OpenAI的新型模型。该确认源于一次429速率限制错误,此错误揭示了来自OpenAI API的相关细节。GPT-2-Chatbot的出现,预示着OpenAI在人工智能领域的新进展和发展。此次...

Read More
2024-05-09 talkingdev

ChemFlow:利用先进的生成模型探索化学空间

ChemFlow是一个新的框架,旨在通过使用深度生成模型高效地导航化学空间,从而提高分子科学的效率。这种新型框架的出现,使化学研究人员能够在化学空间中更加精准地进行探索和导航,从而为分子科学领域的研究和发展开...

Read More
2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ,一种新型量化算法,通过使用4位权重、8位激活和4位KV缓存,加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术,它能够减少模型的存储需求和计算复杂性。在这种情况下,QoQ算法采用了较低精度的数...

Read More
2024-05-09 talkingdev

开源模型DocRes:一站式处理文档图像修复

近期,GitHub上发布了一款名为DocRes的新模型,能够简化文档图像修复的复杂性。该模型旨在处理五个任务:去扭曲、去阴影、美化外观、去模糊以及二值化。所有这些功能都集成在一个系统中,使得用户可以在一个平台上完...

Read More
2024-05-09 talkingdev

Google DeepMind与Isomorphic Labs发布AlphaFold 3,预测蛋白质折叠能力提升50%

Google DeepMind与Isomorphic Labs联手开发了第三代AlphaFold,这是一款强大的蛋白质折叠预测模型。他们正在推出AlphaFold Server,这是一种免费的与模型交互的方式。AlphaFold 3比前两代的准确性提高了50%。它准确...

Read More
2024-05-09 talkingdev

谷歌开源时序基础模型TimesFM:用于时间序列预测

近期,研究人员开发了一种新的时序基础模型,名为TimesFM。该模型可应用于各种时间序列预测问题,包括股票价格、气象数据和交通流量等。TimesFM的优点在于能够处理数据的多种特征,如周期性、趋势性和季节性等。此外...

Read More
2024-05-09 talkingdev

Consistency LLM:将LLMs转换为并行解码器可将推理加速3.5倍

Consistency LLM是一种新的自然语言处理模型,可以将其转换为并行解码器,从而将推理时间缩短至3.5倍。LLM模型是一种具有良好性能的模型,但推理速度较慢。该研究团队将LLM转换为并行解码器,使用了一种名为一致性训...

Read More
2024-05-08 talkingdev

搜索和推荐的融合:新的机器学习模型提出解决方案

传统上,搜索和推荐一直被分开,因为虽然它们在概念上占据了同一光谱的两端,但它们具有不同的工具、架构和机器学习目标。大型语言模型引入了需要小心管理的期望,因为在开放式解决方案空间中引导客户意图是很困难的...

Read More
  1. Prev Page
  2. 258
  3. 259
  4. 260
  5. Next Page