漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-19 talkingdev

E5-V开源-全球多模态嵌入与LLMs

E5-V是一种新的框架,其改编了多模态大型语言模型(MLLMs)以创建全球多模态嵌入。通过使用提示,它弥补了不同输入类型之间的差距,而无需进行微调就实现了在多模态任务中的令人印象深刻的性能。这一全球多模态嵌入...

Read More
2024-07-19 talkingdev

OpenAI推出新款小型模型GPT-4o Mini,颠覆GPT-3.5

OpenAI近日推出了一款新型小型模型——GPT-4o Mini,目标是替代现有的GPT-3.5模型。GPT-4o Mini在MMLU(Mixed Multi-Level Understanding)上的得分为82,这对于低成本模型来说是相当合理的表现。OpenAI一直致力于开发...

Read More
2024-07-18 talkingdev

7岁女孩使用HTML制作网站

近日,一位7岁女孩用HTML制作了自己的网站,让人惊叹不已。她的父亲在社交媒体上分享了这个故事,引起了广泛的关注。 据悉,这位女孩名叫艾米丽,她对计算机编程非常感兴趣。在得知父亲是一名程序员后,她开始学习HT...

Read More
2024-07-14 talkingdev

我用蜂鸣器支持制作了一个Jeopardy游戏制作器

近日,一位开发者在社交媒体上分享了他制作的Jeopardy游戏制作器。该制作器支持蜂鸣器,让用户能够在游戏中模拟电视上的答题环节。据悉,这个制作器使用了最新的Web技术,包括HTML、CSS和JavaScript。它还具有简单易...

Read More
2024-07-10 talkingdev

Linux平台上的Zed编辑器正式发布

代码编辑器Zed宣布正式在Linux平台上发布。Zed是一款用JavaScript、HTML和CSS构建的现代代码编辑器,旨在提高开发人员的生产力。Zed的发布是为了进一步支持Linux生态系统,它可以在Linux上运行,提供流畅的开发体验...

Read More
2024-07-10 talkingdev

学习在测试时:新型RNN变体超越Mamba

最近,一种新型的循环神经网络(RNN)变体在多项任务中的表现超过了Mamba。这种新型的RNN变体的重要特点是其更新函数本身就是一个机器学习(ML)模型。这使得它可以处理长上下文和在上下文中进行学习。在现今的机器...

Read More
2024-06-25 talkingdev

ParaLLM :Mac上基于MLX实现每秒1300个Token推理

MLX中实施批量并行KV缓存,导致合成数据生成和模型完成的推理时间显著提速。这种新的技术实现方式大大加快了处理速度,从而在Mac上每秒可以处理1300个Token。这一突破性的技术进步,不仅可以提高处理效率,同时也...

Read More
2024-06-20 talkingdev

Logit Prisms:分解Transformer输出以提高解释性

Logit Lens方法已经得到了增强,该方法通过分解logit输出,帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流,注意力层和MLP层,揭示了这些部分如何影响预测,并为gemma-2b模型执行的诸如...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page