随着大型语言模型(LLMs)的快速发展,计算机用户可能很快就能编写小型代码。这将对软件的生产和分发带来什么样的结构性变化呢?
过去几周,科技巨头们纷纷发布新成果。OpenAI推出了GPT-4,展现了在编码等多方面的能力提升。微软的研究也展示了GPT-4如何能无提示生成复杂的3D游戏代码。此外,还有针对GPT的插件出现,比如ReAct工具,让用户能更便捷地查询数据。
人们自然会好奇,这些技术将如何影响软件的创作。一方面,专业的开发人员可能会因LLMs而变得更高效,因为GitHub Copilot已经证明了这一点。这让人安心,因为它保证了开发者的职业前景,并暗示软件生产方式不会有根本性的改变。
然而,我认为这只是部分答案。尽管我确信LLMs将成为专业程序员的有用工具,但过于关注这个狭窄的应用可能会错过更大的潜在变革。未来,所有电脑用户可能会有能力从零开始创建小型软件工具,或者描述他们希望对现有软件进行的修改。换言之,LLMs将显著提升终端用户编程的工具支持,使普通人无需陷入复杂编程的繁琐,就能充分利用计算机的通用能力。
如果这个假设成真,我们可能会见证一些意想不到的软件使用方式变化:
- 即时脚本:用户每天都会让AI创作并执行几十次脚本来处理数据分析、视频编辑或自动化繁琐任务。
- 一次性GUI:人们会用AI为特定任务创建完整的GUI应用,只包含所需功能,没有冗余。
- 自主开发:企业会更多地内部开发符合定制需求的软件,而不是购买现成的SaaS,因为定制的成本更低。
- 扩展和修改:消费者和企业要求能够扩展和修改现有的软件,以适应个人工作流程。
- 组合创新:用户可以融合最喜欢应用的最佳特性,创造出全新的混合体。
这些变化不仅会让软件开发过程更快,还会改变软件的产生方式、由谁创造以及为何目的。
关于LLMs和可塑性软件系列探讨:
这是一个话题丰富的领域。在接下来的一系列文章中,我将深入探讨这些由LLMs可能带来的广泛变化,包括用户与软件交互模式的演变,以及如何通过这些新技术更好地赋能用户。我会讨论的问题包括:
- 交互模式:何时需要聊天机器人,何时需要一次性脚本,又或者定制的临时GUI?
- 软件定制:LLMs如何支持用户自定义、重组和扩展软件?
- 意图表达:用户如何与LLMs进行互动,明确他们的需求?
- 数据转换:模糊的数据翻译能力如何促进共享数据平台的实现?
- 用户权力:在LLMs时代,我们应该如何看待授权和自动化的关系?
如果你想要了解这些想法的后续内容,可以通过订阅我的电子邮件通讯或RSS来获取。文章更新频率不会很高,每月最多一次。
何时选择聊天机器人,何时不选?
在LLMs时代,用户交互模型会发生怎样的转变?一个关键问题是,哪些任务更适合聊天界面?我认为这个问题对于思考如何赋予用户权力至关重要。
先预览一下:虽然GPT-4比Siri强大得多,但仍有许多任务并不适合聊天式界面,我们仍然需要图形用户界面。随后,我们将讨论如何结合LLMs来构建UI,实现更深层次的交互。
当触及核心问题时,我们会发现,虽然LLMs在某些场景下能帮助我们编写代码,比如网页抓取或简单的Excel公式,但这并不意味着它们能完全取代直接操作。例如,使用GPT来重新排序网站或添加阅读时间,不如直接在表格中操作直观。用户界面的价值在于,它能让用户看到底层数据的直接视图,进行快速操作,并且可以直接修改公式,从而获得更多的控制权。
下一篇文章将深入探讨用户界面与聊天机器人的关系,但现在让我们暂时偏离主题,思考一下GPT真的能编写代码吗?
GPT真的能写代码吗?
目前,GPT-4的编码能力如何评价?概括来说,它既有令人印象深刻的例子,也有失败的情况。它能处理数据处理的Python代码,也能完成网站数据抓取。微软的一项研究甚至显示,GPT-4能生成运行在浏览器中的复杂3D游戏。然而,它在解决算法问题时仍会困惑,而且在某些高级功能上还有待完善,比如React应用的交互设计。
乐观来看,LLMs具有迭代能力,能根据用户的反馈调整。它们能与用户互动,提出问题以细化需求,并利用常识填充不完整的信息。虽然这并非易事,但预计会有进展。我已经看到GPT-4能询问我对需求的澄清。
另一个关键点是,GPT-4