[博客翻译]大型语言扩散模型 我们认为,大型语言模型(LLM)所展现的智能——包括可扩展性、指令遵循能力、上下文学习能力、对话能力和压缩能力——并非源于自回归机制本身,而是源于生成建模的核心原则:通过最大似然估计近似真实的语言分布。 由 openoker发布于 23天前 模型参数扩散生成可扩展性 阅读次数 85