资讯 | AI千集

我在这里，AI在那里。

1天前

顶级大模型背后的“蒸馏”技术揭秘中国科学院深圳先进技术研究院、北大等机构的研究者发现，许多知名的大语言模型（LLM）如Claude、豆包、Gemini等，都采用了“蒸馏”技术来提升性能。蒸馏是一种将知识从大模型迁移到小模型的方法，能够以更少的资源实现高性能。然而，过度蒸馏可能导致模型同质化，降低处理复杂任务的能力。研究者通过量化分析，揭示了这些模型在身份声明和响应风格上的矛盾，进一步验证了蒸馏技术的广泛应用及其潜在问题。