大规模语言模型(LLMs)已经席卷商业市场,更像是海啸而不是普通的科技热潮。这个话题无处不在——新闻报道、博客、播客、初创企业投资、分析师报告、黑客马拉松和政府公告。围绕它的几乎是一种虚拟的狂热。
如果你具备技术背景,可能会对这种狂热感到困惑。LLMs的技术根源可以追溯到很多年前。然而,今天的体验看起来不仅仅是现有趋势的延续。最近的时代精神发生了一些变化,使得企业家和投资者重新思考并改变了投资的方向。你可能会称其为人工智能淘金热。如果你年纪足够大,还记得它们,你可以将这种狂热与dot com或个人电脑繁荣时期的淘金热相比较。
这些比较有一点道理,更重要的是,淘金热的比喻可以帮助我们理解其中的经济原理。它还可以预测未来(一点点)。但要获得这些回报,你必须精确地了解这个比喻是如何运作的。
山上有经济学,让我们去探索吧。
淘金热
当三个因素齐头并进时就会出现淘金热:惊喜、信息传播和不耐烦的经济参与者。让我们使用1848年的加利福尼亚淘金热来说明这些要素,然后将其应用于LLMs。
具体情况是众所周知的。约翰·马歇尔在萨特新建的磨坊工作,在此前未被探索过的美国河南叉上游地区发现了水中的黄金碎片。马歇尔没有保密,消息在几周内就传开了。换句话说,发现和信息传播这两个要素在一个月内发生了。
那么不耐烦的经济参与者呢?春天的时候,淘金者蜂拥而至萨特的磨坊。到了下一年的雪融化时,该地区挤满了认为他们需要尽快认领的人。许多人在美国河流中淘金。他们被称为“49人”。
遗憾的是,尽管西内华达山脉西部斜坡上含有世界上最好的金矿床之一,但其中大多数并没有河流流过。大多数淘金者没有回收多少黄金,很快就放弃了。
多年后,老式的挖掘活动开始于49人,带来了更好的收益。这项活动既昂贵又缓慢,需要资助一组矿工、建造矿山的专业知识以及寻找金脉地质的经验,并持续了很多年。
这导致了第三个观察结果。Levi Strauss在1853年开始为那些挖掘的矿工提供由帆布制成的坚韧牛仔裤。许多设备供应商发展了业务,通常概括为“镐和铲子”供应商。很多人做得很好。
从这个例子中可以得出三个经济教训。首先,少数早期矿工获利。其次,因为发现表明有一个更大的机会,许多后来通过传统手段利用这个机会的企业表现得很好。这只是需要一段时间。第三,没有必要站在机会的最前线才能从中获利。如果以后有可持续发展的业务,提供必不可少的设备的供应商可以获得很好的利润。
惊喜
让我们回到LLMs。像任何淘金热一样,LLMs的发展包含了一个巨大的惊喜元素。虽然已经有许多开发大型语言模型的努力,但2022年11月发布的ChatGPT3.5展示了自动完成功能,让观察者感到惊讶。
认识到与其他具有长前置时间的技术之间的对比,例如5G。经过多年的努力,它的到来时机并未让人感到意外,其能力也没有让人感到意外,用户接受的速度也没有让人感到意外。5G体验更典型。
有一种简单的方法可以衡量ChatGPT3.5的惊喜和随后的重要性。看看谷歌趋势,它可以衡量一个主题的网络搜索频率。这里的图表是从2022年9月至2023年9月。
图表将单词“ChatGPT”(蓝色)与OpenAI(黄色)进行比较。图表显示ChatGPT和OpenAI在2022年11月初左右成为搜索对象。尽管两者同时开始,但ChatGPT(品牌)最终获得了比OpenAI(创建者)多得多的关注,并保持了这种兴趣。简而言之,这项服务远比赞助它的组织有趣。
谷歌的Bard(红色)出现得较晚,但从未获得如此多的关注。虽然这是市场份额而非市场份额的象征,但这应该会让谷歌管理层感到恐慌。ChatGPT似乎拥有持久的领先地位。
你应该问一下规模问题。就像所有的谷歌趋势一样,y轴是无尺度的,但是不同的主题按比例显示。我们应该如何考虑这种程度的思想份额?以下两条线提供了基准,将ChatGPT与其他热门话题进行了比较,埃隆·马斯克(绿色)和泰勒·斯威夫特(紫色)。
马斯克有过自己的时刻,但他得到的关注远低于ChatGPT。泰勒·斯威夫特不同。没有人能比她在宣传方面做得更好,尤其是在她在全国巡演期间。ChatGPT接近了她,对我来说这似乎相当多。(未显示,我还检查了诸如Stable Diffusion、Dalle-2、Hugging Face、Machine Learning等其他与AI相关的短语。ChatGPT比其他任何东西都受到更多的关注。)以下是关键点:2022年11月意识发生了显著变化。这反映了惊喜。此外,ChatGPT保持了这种理解水平。这反映了新闻的传播和持续的高度兴趣。
淘金热经济学
如果淘金热的比喻有什么启示的话,那就是要警惕那些盲目涌入的傻瓜。相反,看看那些深思熟虑地寻求利用机会的公司。通常情况下,这些成功并不会一夜之间发生。
其次,同样的比喻表明,如果机会持续存在,就会出现一个昂贵的供应链来支持使用LLM的公司。ChatGPT3.5确实需要访问数十亿美元的设备,这是OpenAI通过与微软的合作获得的。目前,建设金矿的成本很高。
相关的是,围绕成本的一个大辩论已经出现。一些专家预计,为了取得更多的突破,资源的无尽军备竞赛将会继续。相比之下,其他人预计随着应用程序完善现有模型或高级模型开发API,成本会下降。前者可能导致只有少数拥有前沿模型的公司,而后者可能导致更便宜的应用程序迅速普及。(我倾向于后一种观点。)
至于第三个观察结果,哪些公司处于有利位置出售现代版的镐头和铲子呢?这推动了像Nvidia、台积电或云提供商这样的组织。毫不奇怪,许多股票交易员也注意到了这一点。例如,自2022年11月以来,英伟达的股价已经上涨了四倍。
我们可以通过更加精确地了解供应链可能如何发生变化来进一步深入。例如,OpenAI设计ChatGPT作为一个通用模型,使用固定日期的公共数据,不针对特定用途进行调整,并未集成到应用程序中。任何关于LLM镐头和铲子的分析都应该预期这些属性会发生变化并启用新的可能性。
考虑实时数据的使用。谷歌是获取最新信息的最佳渠道。这就是为什么许多分析师期望它推出能够在最近的数据上训练LLM的产品。到目前为止,Bard还没有达到这个理想状态,但许多投资者都在押注它是否会实现。
很容易想象将自动完成功能与特定数据集结合起来——例如,待售商品的库存。这可能会极大地改善电子零售业。想象一下,以自然语言而不是关键词询问黑色连衣裙,然后与网站来回沟通,以细化搜索,找到适合晚上外出穿的时尚连衣裙,而不是葬礼穿的连衣裙。这种体验将改善大量的电子商务网站。
对我来说,最令人兴奋的应用程序是那些混合语音识别和对话的应用程序。许多环境,如你的汽车,如果司机可以与汽车交谈而不是按按钮,将会得到改善。同样,这个理想已经被讨论了很多年,但现在许多汽车公司正在建立原型进行开发。ChatGPT带来的收益使得这一理想成为可能。
还有什么呢?
另一种流行的观点从供应链中的人而不是设备开始。它考察职业,如诉讼律师或程序员,并根据职业是否受益于LLM的部署来预测影响。
考虑编码,Copilot在GitHub上可用,是第一个能完成编程的LLM,可以加快任何流行语言的编程速度。现在有许多版本可供选择。这提高了程序员的生产力,使他们更快地完成工作,从而提高了有价值领域的程序员的工资。这些预测有助于组织在未来几年内制定人力资源计划,特别是在雇佣大量程序员的组织中。
下一个问题更具挑战性。哪个雇用更多生产力高的员工的组织会受益?在一个工种的生产力提高和整个组织的价值之间的步骤很多。例如,生产力更高的程序员使数据科学家更有价值,但这将如何改变一个组织呢?这并不那么明显。雇佣许多数据科学家的组织在管理这种类型的破坏方面各不相同。换句话说,在没有更多补充证据证明一个组织知道如何明智地使用它的情况下,不应该轻易地基于这种洞察力进行股票市场投资。
结论
LLM总是根据过去的数据进行训练,因此它们在今天的任务与昨天相似的领域具有优势。这些领域以外的预测则较弱。
尽管如此,这种连续性使一些有用的分析成为可能。比如淘金热,有助于识别在这些环境中起作用的一些机制。也就是说,仅靠类比淘金热是不够的。市场预测仍然需要深入的领域知识和精细的经济直觉。