漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-03 talkingdev

流媒体LLM:一种理论上可以支持无限上下文窗口大小的语言模型算法更新

语言模型的性能往往受到其上下文长度的限制。一般来说,上下文长度的限制主要源于计算硬件和聪明的算法更新。StreamingLLM(Github Repo)提供了一种算法更新,通过将令牌流式传输至注意力机制,理论上可以支持无限...

Read More
2023-10-03 talkingdev

模式移动公司的创新产品EarnPhone:这是首个颠覆智能手机的产品吗?

经过15年的发展,智能手机行业是否即将迎来它的“乔布斯式”创新产品?模式移动(Mode Mobile)公司的EarnPhone或许给出了答案。这款创新型手机的诞生,为消费者带来了超过150万美元的收益。如今,该公司的年收入已经...

Read More
2023-10-03 talkingdev

Cloudflare推出全球GPU网络上的无服务器AI推断平台——Workers AI

Cloudflare近日发布了一款名为“Workers AI”的无服务器人工智能推断平台,该平台运行在其全球GPU网络上。Workers AI提供了多种流行的开源模型,并与Hugging Face进行了合作。通过无服务器计算的方式,用户可以在Cloud...

Read More
2023-10-02 talkingdev

洞悉阅读人脑的AI技术

越来越多的初创公司如Neuralink、Mendi和FocusCalm等,正在研发帮助我们阅读和操控自身精神状态的技术,以帮助我们放松、学习和减轻疼痛。这些公司将从用户的大脑中收集数据,如果他们得到访问权限的话。然而,这些...

Read More
2023-10-02 talkingdev

Dataiku发布LLM Mesh,并宣布Snowflake、Pinecone和AI21 Labs成为首批合作伙伴

Dataiku近日发布了LLM Mesh,以解决在企业中集成LLM的有效、可扩展、安全平台的紧迫需求。LLM Mesh位于LLM服务提供商和最终用户应用之间,公司可以根据自己的需求选择最具成本效益的模型,以确保其数据和响应的安全...

Read More
2023-10-02 talkingdev

辨别真实与虚假面孔的新研究

本研究利用视觉和语言工具,提高系统识别真实与虚假面孔的能力。在当前的科技发展中,面部识别技术已经被广泛应用于众多领域,包括安全监测、社交媒体以及各类身份验证等。然而,这种技术也面临着虚假面孔的挑战,通...

Read More
2023-10-02 talkingdev

Transformer-VQ:一种高效的线性时间关注模型

最新的研究成果Transformer-VQ,是一种全新设计的Transformer,由于其独特的基于向量的键和缓存功能,使得处理注意力的速度得到了显著的提升。这种新型的Transformer设计,不仅提高了处理速度,同时也保持了数据的准...

Read More
2023-10-02 talkingdev

视觉变换器的需求:寄存器

近几周出现的最酷、最简洁的视觉论文之一。视觉变换器使用“无用”的像素值作为存储全局信息的地方,这使得注意力映射变得难以解读。然而,如果你向词汇表中加入一个简单的 [reg] 标记,模型就会使用它,而不会将信息...

Read More
  1. Prev Page
  2. 911
  3. 912
  4. 913
  5. Next Page