漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-26 talkingdev

EvalAlign:一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同,EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是,EvalAlign不...

Read More
2024-06-25 talkingdev

Toucan-基于全球7000种语言的文本转语音TTS模型开放

近期,Toucan发布了一套新的文本转语音模型,这套模型已经扩展,可以支持所有ISO-639-3标准语言。这个开创性的举措,将使全球各地的用户都能享受到语言转换的便利。无论是在学习、工作,还是日常生活中,这都是一项...

Read More
2024-06-24 talkingdev

AI技术大潮下,自由职业者的就业市场遭遇冲击

随着人工智能(AI)的快速发展,基于基本写作、编程或翻译的自由职业岗位在在线招聘平台上逐渐减少。自ChatGPT等生成式AI模型推出以来,这些领域的自由职业岗位减少了高达21%。尽管如此,一些公司开始重新考虑自由职业...

Read More
2024-06-06 talkingdev

DreamMat:利用经典图形技术提升3D纹理渲染效果

DreamMat 是提升3D对象纹理生成质量的绝佳方式。它利用了多种经典图形技术,如Albedo、Metallic和Roughness,能够在给定的3D网格上渲染出极具吸引力的输出效果。这些技术通过精细的细节处理和物理基础渲染(PBR)方...

Read More
2024-06-04 talkingdev

Google Cloud推出Claude 3 Opus,增强Vertex AI功能

Google Cloud近日宣布推出Claude 3 Opus,这一新模型将作为其Vertex AI产品的一部分,进一步增强其人工智能工具的应用能力。Claude 3 Opus不仅仅是一个升级版本,它还包括了多种小型模型,能够更加灵活和高效地处理...

Read More
2024-06-03 talkingdev

Nvidia计划推出搭载Arm和Blackwell核心的AI PC芯片

据报道,Nvidia正在准备一款系统芯片(SoC),该芯片将Arm的Cortex-X5核心设计与基于Nvidia Blackwell架构的GPU相结合。这一组合旨在提升人工智能计算性能,为PC提供更强大的AI处理能力。Nvidia的这一举措可能会显著...

Read More
2024-06-03 talkingdev

Mozilla开发浏览器内运行的图片自动生成Alt文本模型

Mozilla公司最近成功训练了一款可以在浏览器内运行,并自动为网页图片生成替代文本(Alt文本)的模型。这一创新技术旨在提高网页的无障碍性,使视力障碍用户能够更好地理解网页内容。通过在本地运行模型,Mozilla不...

Read More
2024-05-23 talkingdev

Tarsier:提升LLMs与网页交互的开源工具

Reworkd公司近日发布了一款名为Tarsier的新工具,旨在通过使用括号和ID对网页元素进行视觉标记,增强大语言模型(LLMs)的网页交互任务处理能力。Tarsier利用OCR生成的文本表示,使得没有视觉功能的LLM也能理解网页...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page