[论文翻译]PaLM 2技术报告
我们推出PaLM 2,这是一款全新的先进大语言模型,相比前代PaLM具备更出色的多语言处理与推理能力,同时计算效率更高。PaLM 2是基于Transformer架构的模型,采用混合训练目标进行训练。通过对英语及多语言任务、推理任务的大量评估,我们证明PaLM 2在不同模型规模下均显著提升了下游任务的质量,同时相比PaLM实现了更快、更高效的推理。这种效率提升使得模型部署范围更广,响应速度更快,交互节奏更自然。PaLM 2展现出强大的推理能力,在BIG-Bench等推理任务上较PaLM实现大幅提升。该模型在负责任AI评估套件中表现稳定,支持无额外开销的毒性推理时控制且不影响其他能力。总体而言,PaLM 2在多样化任务与能力维度均实现了最先进的性能表现。