漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-01 talkingdev

论文:SliceGPT高效简化大型语言模型的新方法

SliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...

Read More
2024-01-25 talkingdev

自动驾驶作为AGI的案例研究

人工通用智能(AGI)通常被定义为在大部分经济有价值的工作中超越人类能力的自主系统。自动驾驶的最新发展是增加自动化的社会动态的一个好的早期案例研究。驾驶是一个难以自动化的问题,其自动化将影响大量人力资源...

Read More
2024-01-24 talkingdev

TypeSpec:云服务API的描述语言

TypeSpec是一种描述云服务API并生成其他API描述语言、客户端和服务端代码、文档和其他资源的语言。它提供了高度可扩展的核心语言原语,可以描述REST、OpenAPI、GraphQL、gRPC和其他协议中常见的API形状。TypeSpec可...

Read More
2024-01-23 talkingdev

谷歌X实验室裁员,希望项目寻求外部资助

谷歌母公司Alphabet旗下的“Other Bets”集团中的X实验室是一家“月球计划”试验性机构,每个季度的亏损达到10亿美元。近日,谷歌宣布从X实验室裁员“数十人”,并鼓励该实验室的项目寻求外部资助,以持续运作。尽管X实验...

Read More
2024-01-23 talkingdev

如何应对行为面试?GitHub推出新仓库提供资源和技巧

GitHub最近发布了一个名为《Awesome Behavioral Interviews》的新仓库,旨在为用户提供准备行为面试的技巧和资源。该仓库涵盖了一般性质的技巧、可能被问到的问题,以及您可以问面试官的问题。每个面试问题都附带了...

Read More
2024-01-22 talkingdev

Diffusion模型可用于内容超分辨率

随着最近将扩散模型用于各种其他视觉任务的趋势,本研究改进了超分辨率的训练稳定性和缩放。

Read More
2024-01-22 talkingdev

Stablecode3B:比7B的CodeLlama更出色,可在MacBook上本地运行

据悉,最近发布的Stablecode 3B模型表现出色,其强大的性能超过了7B的CodeLlama模型。同时,该模型的尺寸足够小,能够在MacBook上本地运行,无需像7B模型一样需要大量的计算资源。这一模型的发布,标志着技术领域的...

Read More
2024-01-16 talkingdev

马斯克寻求更多对特斯拉的控制,寻求25%的投票权

马斯克周一表示,他想要掌控特斯拉约25%的投票权。马斯克已经拥有公司约13%的股份。他表示,在没有掌控的情况下,他不会让特斯拉成为人工智能和机器人领域的领导者。他想要有影响力,但不至于被推翻。寻求更多控制权...

Read More
2024-01-12 talkingdev

OpenAI推出GPT商店

OpenAI推出了GPT商店,该商店允许开发人员通过构建这些代理来获取报酬。该公司计划每周推出新的GPTs。GPT是一种基于人工智能的语言处理技术,可以用于各种自然语言处理任务。此举旨在促进GPT技术的发展和应用,为开...

Read More
2024-01-09 talkingdev

DiffusionEdge,最新边缘检测模型开源

DiffusionEdge是一种新颖的边缘检测模型,它集成了扩散概率模型,可以在资源有效的同时提供更准确和清晰的边缘图。传统的边缘检测模型对于噪声和边缘不清晰的情况表现得不够稳定。DiffusionEdge的扩散模型可以帮助减...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page