[博客翻译]为什么我选择DSPy：深度解析

什么是DSPy？

如果你对DSPy还一无所知，那它就是一个开源框架，帮你以原则化的方式将多个大语言模型（LLMs）组合起来，以解决复杂问题。它并非传统机器学习中的单纯模型训练，而是关乎问题导向的多模型集成。

传统机器学习与LLMs解决问题的不同

在传统机器学习中，你面对的是特定任务或问题，比如预测销售、产品推荐等。你需要有数据来观察并训练模型，比如图像分类的“热狗”或“非热狗”识别。模型的好坏可以通过精确度、召回率等指标来衡量。没有明确问题，模型就像是无目标的训练，意义模糊。

LLMs的现实应用

尽管LLMs能生成文本，但要产生价值，它们必须被用来解决具体问题，这个过程通常需要可量化的数据集或指标来锚定。无目标的LLM链路组合在长期解决现实问题时是不可持续的。你怎么知道你的提示方向是否正确？如何确认你真正解决了问题？数据分布变化或管道微调如何应对？

DSPy：问题导向的解决方案

DSPy强制你使用可验证的反馈来解决问题，无论是通过对比真实答案的多选题、分类，还是让LLM判断答案质量。这让你在关心的领域有所进展，而非只是猜测。

LLMs的误解：逻辑推理并非全部

人们常误解LLMs能进行传统意义上的推理。实际上，它们擅长模式匹配和数据分布的处理，DSPy通过这种方式创建了所谓的“推理系统”，它们能执行它们被设计去的任务。

人们不了解的LLMs真相

人们提到的“推理系统”是LLMs能力的误解所在。LLMs能根据正确引导生成解决方案，甚至在零样本情况下。这背后是随机过程，DSPy帮助引导这种随机性，以更可能有助于你解决问题。

自动提示优化的真相

人们常以为LLMs能自我批判和改进提示，这是错误的用法。DSPy利用LLMs的创造力，通过生成创意变体来优化提示，并在评估集上验证这些变体，而非通过推理。

结论：DSPy的价值

我个人坚信，DSPy将继续作为复合LLM系统解决现实问题的强大工具。它致力于与新研究同步发展，而非仅停留在论文层面。尽管存在一些问题（比如可靠性问题和新手友好度问题），DSPy团队正在努力改进，确保可靠性和易用性。

如果你在阅读本文时对DSPy感兴趣，我希望你能带走两个关键点：

总的来说，我坚信DSPy将帮助我们解决那些曾经看似不可能的难题，让我们一起探索这个神奇的工具。