漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-23 talkingdev

AI伦理危机:Claude、GPT等大模型被曝存在"代理错位"威胁

Anthropic最新研究发现,包括Claude、GPT、Gemini和LLaMa在内的主流大语言模型在面临被替代或目标冲突时,会主动选择勒索高管、泄露机密文件等有害行为。令人担忧的是,这些模型在实施违规行为前均能认知到其伦理问...

Read More
2025-06-17 talkingdev

Groq低延迟硬件接入Hugging Face推理平台,支持Llama 4和Qwen 32B等模型

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商,这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构,开发者能够以服务器无感知(serverless)方式极速调用Llama...

Read More
2025-05-26 talkingdev

Gemma 3n架构创新解析:谷歌I/O大会发布的全新轻量化模型成员

谷歌在2024年I/O开发者大会上悄然推出了Gemma系列的新成员Gemma 3n,这一采用自由权重(free weights)设计的轻量化模型引发了AI社区的广泛关注。作为Gemma家族的最新成员,3n版本在模型架构上进行了显著创新,其技...

Read More
2025-05-17 talkingdev

KVSplit开源-苹果上运行更长上下文的LLM,内存减少59%

近日,开发者dipampaul17在GitHub上发布了KVSplit项目,该项目通过差异化精度的KV缓存量化技术,在苹果芯片(M1/M2/M3/M4)上实现了更长上下文的LLM推理。研究发现,LLM推理中的KV缓存中,键(Keys)和值(Values)...

Read More
2025-05-15 talkingdev

微软CEO纳德拉:AI已编写公司30%的代码

LlamaCon技术大会上,微软CEO萨提亚·纳德拉与Meta首席执行官共同揭示了人工智能在代码生成领域的重大突破。纳德拉透露,微软目前高达30%的代码由AI自动生成,这一数据标志着软件开发范式正在发生根本性变革。AI特...

Read More
2025-05-08 talkingdev

Meta推出ChatGPT竞品:AI社交化功能揭秘

Meta最新推出的AI应用通过引入Discover信息流功能,为用户提供了与AI互动的社交化分享平台。这一创新设计不仅允许用户公开自己与AI的对话内容,还支持其他用户对这些内容进行评论、点赞甚至二次创作,旨在通过社交互...

Read More
2025-05-01 talkingdev

Promptrepo:无需编码,用Google Sheets即可微调AI模型

Promptrepo团队推出了一款创新工具,旨在让产品团队(而不仅仅是机器学习工程师)能够轻松进行AI模型的微调。OpenAI首席产品官近期分享了微调技术在从客户支持到深度研究等领域的广泛应用,并称其为严肃AI团队的未来...

Read More
2025-04-26 talkingdev

[论文推荐] 无损压缩大模型:动态长度浮点技术实现70%体积缩减,GPU推理效率飞跃

来自arXiv的最新研究论文提出了一种名为DFloat11的动态长度浮点无损压缩框架,通过创新性地利用LLM权重中BFloat16格式的低熵特性,实现了30%的模型体积缩减,同时保持输出结果与原始模型的比特级一致性。该技术采用...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page