GPT三种转换路径

GPT 目前很火热,从大公司到个体,到处都在研究它。

在落地应用上,目前浅层的需求已经被挖掘得差不多,现在到了需要深挖垂直领域的阶段。

要把垂直领域需求转化落地,路径可以归纳成 3 种,其中只有 2 种有前途,里面只有一种是适合我们普通人的。

第一种途径,就是自主研发。自己准备垂直领域的相关数据, 训练一个专用的业务模型。这种途径效果最好。当然,门槛也是最高的,因为这需要具备相当程度的技术能力和硬件资源,以及钞能力。

第二种途径,就是基于通用大模型、垂直领域数据向量化,再结合 Prompt 提示工程。这种门槛最低,只要你会一点编程,能对接 OpenAI 这些的大公司的接口,就能进行开发。当然,目前这个方案的效果不如第一种。

第三种途径,则是中间路线。例如 Fine-Tune 大模型,利用模型的开放能力,把业务知识结合进去。这种途径的门槛比自主研发低一些,而效果比通用大模型好一些。

三种路径的优劣好坏 ,单纯从技术角度讨论是不会有结论的,不过我们可以从经济的角度出发去分析。

经济领域有这么一个概念,叫杠铃现象和策略。杠铃就是健身那种器材。在投资中,收益往往集中于高风险高收益,和低风险低回报这个两端,中风险中回报反而少,像杠铃一样两头重中间轻。

杠铃现象和策略在产品设计和技术路线也是有效的。三种路径,第一种自主研发,投入高效果好,第二种投入低效果差,第三种在中间地带。

然而,随着时间推移,技术会发展。自主研发因为量产和边际效应,投入会减少,通用大模型会越来越标准化,和向量数据库和 Prompt 工程结合的效果会越来越好。

这两个路径会不断往中间靠,挤占 Fine-Tune 这些中间路线的空间。简单粗暴一点来说,中间路线没前途。

当然,中间路线不会完全被取代和消失这么极端,但肯定不会形成规模,成为主流。

所以,只有自主研发和通用大模型,这两个极端,才是有前途的路径。

前面说到,两种有前途的路径里面,只有一种适合我们普通人。很显然,肯定是第二种通用大模型这个路径。

自主研发只 有一定财力的大公司大团队才玩得起。而对于我们普通人,通用大模型也有很多优势。

首先是灵活,你能快速响应需求。

另外,通用大模型会越来越标准化,就像 CPU、GPU 一样。我们可以专注在向量化、Prompt 这些真正沉淀和体现我们的垂直领域知识的地方,和模型会越来越解耦。

所以,放心搞通用大模型路线就好。

Data 360 管理员
Data 360 管理员

发表回复

文章结构
相关文章