语言模型的相关内容 - 漫话开发者

2025-01-23 talkingdev

MTU-Bench：全新基准测试评估LLM工具使用能力

近日，MTU-Bench作为一种全新的基准测试工具正式发布，旨在评估大型语言模型（LLMs）在不同场景下的工具使用能力。该基准测试通过多样化的任务设计，全面衡量LLMs在实际应用中的表现，特别是在复杂任务中调用外部工...

2025-01-23 talkingdev

近日，GitHub上发布了一个名为MedSSS的医疗推理项目，该项目是一个基于自进化管道的慢思考小型医疗语言模型。MedSSS的设计旨在通过模拟人类医生的慢思考过程，提供更精准的医疗推理能力。该模型通过自进化管道不断优...

2025-01-23 talkingdev

SambaNova推出的EvaByte模型在字节级语言建模领域取得了显著进展。尽管其性能仅与两代前的模型（如Llama 2）相当，但对于长期受限于10亿参数以下的字节级模型来说，这无疑是一个重要的突破。EvaByte的成功不仅展示了...

2025-01-22 talkingdev

近期，Hacker News上的一篇帖子引发了社区的热烈讨论，主题是关于小型语言模型（LLM）的创新应用。在这个数据驱动的时代，大型语言模型以其强大的功能和广泛的应用而备受瞩目。然而，小型语言模型以其较小的规模和较...

2025-01-17 talkingdev

近期，软件工程领域出现了一种新的开发实践——利用大型语言模型（LLM）来实施测试驱动开发（TDD）。这种方法通过机器学习技术的强大能力，先编写测试用例，再开发通过测试的代码，能够提升代码质量和开发效率。大型语...

2025-01-07 talkingdev

编程领域迎来了革命性的进步，大型语言模型（LLMs）正在改变开发者的编程方式。这些模型通过深度学习技术，能够理解自然语言指令，并据此编写代码。开发者现在可以借助LLMs快速实现功能，优化代码结构，甚至解决复杂...

2025-01-06 talkingdev

近期，大型语言模型（LLM）因其强大的文本生成能力和广泛的应用场景而受到业界关注。LLM可以完成从文本翻译到内容创作等任务，但其安全性和可靠性引发担忧。一方面，LLM可能被用于生成虚假信息或进行网络攻击，造成...

2025-01-05 talkingdev

近日，One Dog项目成功复现了Windows 3.1版本的图形界面，通过AI技术，该项目不仅精确模拟了Windows 3.1的图形栈，还展现了其与现代操作系统图形界面的对比。One Dog团队运用最新的LLM（大型语言模型）技术，通过emb...