漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2024-02-02 talkingdev

FireLlava-商业许可的视觉模型开源

FireLlava是一个新的开源视觉模型,经过数据训练,可以用于商业任务。它与原始Llava的性能相当,但还没有达到Llava 1.5的水平。

Read More
2024-02-02 talkingdev

Mistral CEO确认泄露的新开源AI模型接近GPT-4的性能

AI社区因HuggingFace和4chan分享的一个名为“miqu-1-70b”的泄漏大型语言模型而感到兴奋。该模型表现出能与OpenAI的GPT-4相媲美的性能,并与Mistral的Mixtral 8x7b有关。Mistral的CEO确认这是一位热情的客户泄露的,这...

Read More
2024-02-02 talkingdev

Stanchion:SQLite3扩展程序,实现列式存储

Stanchion是一款SQLite 3扩展程序,可以在SQLite中实现列式存储。它将列式存储和数据仓库的所有优势带到了SQLite已经部署的任何地方。相对于行式存储,列式存储在存储和处理指标、日志和事件数据、时间序列数据存储...

Read More
2024-02-01 talkingdev

论文:SliceGPT高效简化大型语言模型的新方法

SliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...

Read More
2024-02-01 talkingdev

谎言、诅咒和基准测试

基准测试是非常有用的工具,但由于其狭窄的范围、过度拟合、污染、可重复性问题和缺乏范围,它们并不是真实世界实用性的最佳指标。

Read More
2024-02-01 talkingdev

Mistral CEO确认新的开源AI模型泄露,接近GPT-4的性能

本周,Mistral公司的CEO确认了Mistral的一个量化版本文件在HuggingFace上泄露,该技术使得在较弱的电脑和芯片上运行某些AI模型成为可能。据报道,该模型在EQ-Bench上超过了全球所有其他LLM模型,仅次于GPT-4。Mistra...

Read More
2024-01-31 talkingdev

React Email 2.0发布:重构预览体验、性能大幅提升、新增组件和支持Vercel部署

React Email 2.0发布,该版本重构了预览体验,性能大幅提升,新增组件,支持Vercel部署,同时对monorepos提供更好的支持。React Email 2.0是一款专门用于构建电子邮件的React组件库,该组件库可帮助开发者更快速、更...

Read More
2024-01-31 talkingdev

C语言有界模型检查器:被严重低估的工具

C语言有界模型检查器是一种非常有用的工具,但是在实际应用中却被严重低估。该工具可以帮助开发人员在代码编写过程中发现并解决一些常见的编程错误,例如数组越界、空指针引用等。这些错误在实际应用中可能会导致程...

Read More
2024-01-30 talkingdev

CPU创业公司Tachyum声称其处理器单元可以媲美数十个Nvidia H200 GPU

Tachyum即将开始大规模生产其Prodigy Universal处理器,这是一款多功能处理器,结合了CPU,GPU和TPU的功能,承诺显着提高云计算,高性能计算和人工智能应用的性能。这可能会颠覆AI市场。

Read More
  1. Prev Page
  2. 74
  3. 75
  4. 76
  5. Next Page