转自公众号：腾讯云开发者
http://mp.weixin.qq.com/s?__biz=MzI2NDU4OTExOQ==&mid=2247631401&idx=1&sn=8cb7ec503833b643e8203b8b71a3f225

??腾小云导读

GPT 出现之后，很多人推测大量的软件都会因为其出现而重写。本文主要是低代码平台与 ChatGPT 结合的一些思考以及实践。期望与各位读者一起搭上 AI 这列快车，为开发提提速～

??目录

1 背景

2 Demo 演示

3 思路

3.1 ChatGPT+代码生成工具结合模式

3.2 ChatGPT 代码生成现状

3.3 现阶段可行的思路

3.4 案例

4 设计实现

4.1 架构分层

4.2 插件化

4.3 研发调整

5 总结

01

背景

从探索模型驱动开发开始，我一直在思考一个问题：“软件，是否可以用更简单、更人性化的方式生成”，ChatGPT 给我了一个肯定的回答。

我们此前根据领域模型在生成代码方面进行了一些探索，希望用建模时间高倍率置换编码时间。随着代码工具的不断完善，效率提升越来越难，因为模型是抽象的而实现是具体的，模型所承载的信息并不足以直接生成代码，一定需要“人”来补充信息，这部分工作工具无法替“人”来完成。

直到体验了 ChatGPT，在震惊于它强大的能力同时，我们也就“如何将 ChatGPT 引入我们的代码生成工具来提升研发效能”进行了思考，并且快速搭建了一些 Demo 验证效果。

02

Demo 演示

“Talk is cheap. Show me the code”，先看效果：

视频中类图、分析序列图来源于 UMLChina

这里演示了工具基于领域模型生成代码的流程，在第3到5步工具集成了一个基于 ChatGPT 接口实现的插件，该插件自动提取模型中的中文类名、成员变量名、成员函数中文名，然后将中文名以及翻译用途、命名风格输入到 ChatGPT 得到翻译结果，并自动填充回工具，最后生成代码。

这里仅仅是简单地使用了 ChatGPT 的翻译能力，却给我们带来了巨大的提升，想象一下一个项目数十个类名、数百个成员变量名以及函数名需要根据中文翻译为英文，有些词还要使用翻译软件翻译后再根据使用用途（类名使用名词或者名词短语、方法名使用动词）转换词性，然后调整为大驼峰或者下划线连接等风格，这是多么无趣和繁琐的工作，而现在只需要一键填充，然后做微小调整即可。

仅接入了 ChatGPT 的翻译能力就提效如此明显，那如果将 ChatGPT 的能力封装为一个一个插件嵌入到整个研发过程，那会达到什么效果呢？

03

思路

3.1 ChatGPT+代码生成工具结合模式

3.1.1 模式一：直接生成软件

这种模式让 ChatGPT 理解人类语言并编写软件，例如 ChatGPT 完全可以生成一个可运行的贪吃蛇小游戏，当然严格意义上这种模式并不是 ChatGPT 和代码生成工具结合，因为根本不需要代码生成工具参与，这无疑是最简单、最自然的软件开发方式。

遗憾的是通过测试发现：ChatGPT 现阶段并不能直接通过对话编写出完整的、复杂的软件，因为软件有自己的核心域知识，而且不同的团队都有自己的规范、环境等要求，例如谷歌使用 gRPC 框架、部署在谷歌云，而亚马逊的研发框架和部署环境与谷歌完全不同。我们不可能将这些信息全部输入到 ChatGPT（这些信息太多了，通过会话描述这些信息需要大量的工作，除了考虑性能以外也担心敏感信息泄露问题）。现阶段该模式无法实现。我想，尽管 AutoGPT 的出现说明 AI 确实可以从0到1完成一个项目，但我想没有人敢将它生成的项目直接应用于生产环境。

3.1.2 模式二：生成代码片段

通过会话将代码上下文信息输入到 ChatGPT，它基于这些信息完善、编辑代码，例如 Copilot 插件就是该模式。测试发现 ChatGPT 生成代码片段的质量比较高且比较稳定。

该模式和模式一的区别是代码是“工具”将 ChatGPT 生成的“代码片段”进行组织，最终形成完整的软件。

3.1.3 模式三：生成DSL

将自然语言转换为 DSL ，然后基于 DSL 生成代码或者软件，这种模式和方案二的区别是 ChatGPT 不直接生成代码，代码是由工具根据 ChatGPT 生成的 DSL 生成。ChatGPT 生成 DSL 相对稳定，这种模式生成的代码质量相对前两种模式更加可靠。

3.2 ChatGPT 代码生成现状

“知彼知己，百战不殆”，我们首先要对 ChatGPT 的能力有个清晰认识，这样才能选择正确的模式。我们阅读了一些 GPT-4 能力测评论文，也做了大量的实验验证，说几个有意思的点：

ChatGPT 是“懂”代码的，给出一段代码可以正确的添加注释，甚至还可以根据上下文优化变量命名、完善代码；
ChatGPT 是会“猜”代码的，仅仅给出一个函数声明，它可以根据函数命名、参数命名猜测函数的功能，并生成测试用例；
ChatGPT 生成通用代码（例如基础库）比较容易，但是生成特定领域的代码可能不符合该领域的最佳实践；
ChatGPT 生成代码质量和使用者有关，输入越准确生成代码质量越高，输入内容过多或者过少都会导致生成结果变差。

在实际场景中我们写代码所依赖的信息非常多，除了当前文件的上下文还可能跨文件、跨系统、跨仓库……但是由于 ChatGPT 对输入长度的限制，将所有依赖信息输入到 ChatGPT 是不现实的（时间成本、敏感代码泄露）；另外一个问题是交互模式，如果代码是离线生成还好，但如果是“和 ChatGPT 结对编程”对实时性要求是非常高的，想象一下如果 Copilot 每次生成提示都需要1分钟你还会用吗？

3.3 现阶段可行的思路

结合上述信息，我们认为尽管目前 GPT4 能力非常强大，但是并不能做到全自动生成应用，尤其是针对某个行业需要匹配该行业的最佳实践和领域知识，需要遵循团队研发规范。这些是 ChatGPT 现阶段所无法做到的。那基于 ChatGPT 现有的能力，如何嵌入到代码生成工具中呢？我作了一些粗浅的思考：

利用 ChatGPT 辅助生成 DSL，将 DSL 导入到低代码平台生成符合团队规范的业务代码；
将第一步生成的代码输入到 ChatGPT，由 ChatGPT 根据上下文补充生成代码片段并填充到对应位置；

读到这里也许会有疑问，这明显就是模式二和模式三的结合，为什么要分两次让 ChatGPT 生成代码呢？我下面用一个案例进行详细解释。

3.4 案例

3.4.1 信息提取

如上图所示，这是系统用例“接收车位状态变化”的分析序列图，通过分析序列图我们可以得到如下信息：

· 控制类有一个方法为“停车收费”；

· 控制类的“停车收费”方法依赖实体类“泊位”；

· 分析序列图中的实体类的成员变量可以在类图中得到，所有指向该实体的箭头都映射为一个方法；

· 可以根据分析序列图得到控制类和实体类方法的伪代码，例如“来车”的伪代码如下：

int 泊位::来车(){
  // 1、取值班人员
  排班(时间).取值班人员(值班人员序号);
  if(失败){
    打印日志
    返回失败错误码
  }
  return 0
}

3.4.2 构建DSL生成代码

显然上述信息并不足以生成代码，以“泊位::来车”这段伪代码为例，要想映射为一段符合C++语法的代码，至少还需要完善下面这些信息：

翻译，伪代码中的单词都要翻译为英文；
补充字段类型，时间字段是什么类型；
模式配置，例如“取值班人员”方法失败怎么定义？根据返回码判断还是根据某个出参判断；

做完这些工作后，我们才能将上述伪代码使用结构化的语言描述以便生成代码，例如：

{
    \\\"return_type\\\":\\\"int\\\",
    \\\"function_name\\\":\\\"ArriveCar\\\",
    \\\"param\\\":[],
    \\\"impl\\\":[
        {
            \\\"entity\\\":\\\"Scheduling\\\",
            \\\"function\\\":\\\"GetShiftPersonnel\\\",
            \\\"return_type\\\":\\\"int\\\",
            \\\"param\\\":[
                {
                    \\\"type\\\":\\\"int\\\",
                    \\\"name\\\":\\\"number\\\"
                }
            ]
        }
    ]
}

事实上需要配置的信息远远不止这些，而且完成这些工作的知识都在“人脑”中，只能人来完成，构建可以生成的代码的 DSL 并不简单。当然我们可以通过一些方法来减少人的工作：例如将填空题修改为选择题（大多数配置都是勾选操作而不用输入文字）、总结最佳实践添加默认选择项（例如成员变量默认不生成Get函数）等等，然而始终有一部分工作是繁琐、重复、低效且需要人来完成的，例如上述步骤中的中文根据使用情景不同翻译为不同词性、不同格式的英文单词。而这部分工作就需要引入 ChatGPT 来完成，由人来翻译500个中文词可能需要50分钟（10个/分钟），而让 ChatGPT 来翻译仅需要几秒钟。

3.4.3 完善代码

经过第一步从模型提取信息、第二步将信息转换为生成代码所需要的 DSL ，这时候我们就可以生成代码了，下面是我们生成的代码目录的一个案例：

我们打开上述目录中的头文件、PROTO 文件不仅满意的点了点头。但当我们点开泊车类的 .cpp 文件见到下面内容不仅吐槽：生成的代码并不能直接运行！

// 来车
int ParkingSpace::ArriveCar() {
  //// MDD-TAG-BEGIN:[flow][slot-ArriveCar][函数实现]
  int ret = 0;
  // 取值班人员
  Scheduling scheduling (/*请填充参数*/);
  ret = scheduling.GetShiftPersonnel(number);
  if (ret != 0) {
    LOG_VERR(\\\"--->>错误事件名<<---\\\", ret, \\\"GetShiftPersonnel_ERR\\\");
    return ret;
  }
  return ret;
  //// MDD-TAG-
                                                        原创文章，作者：网络技术联盟站，如若转载，请注明出处：https://www.sudun.com/ask/34677.html

低代码平台开源（低代码开发平台开源）

01

02

03

3.1 ChatGPT+代码生成工具结合模式

3.1.1 模式一：直接生成软件

3.1.2 模式二：生成代码片段

3.1.3 模式三：生成DSL

3.2 ChatGPT 代码生成现状

3.3 现阶段可行的思路

3.4 案例

3.4.1 信息提取

3.4.2 构建DSL生成代码

3.4.3 完善代码

发表回复

低代码平台 开源（低代码开发平台 开源）

01

02

03

3.1 ChatGPT+代码生成工具结合模式

3.1.1 模式一：直接生成软件

3.1.2 模式二：生成代码片段

3.1.3 模式三：生成DSL

3.2 ChatGPT 代码生成现状

3.3 现阶段可行的思路

3.4 案例

3.4.1 信息提取

3.4.2 构建DSL生成代码

3.4.3 完善代码

相关推荐

教你如何查看你的朋友圈以及拍摄太空照片的真实地点！ 10秒学会！

移动点餐销售软件：了解移动点餐销售软件的选择和应用

failed to read（change to read药典）

如何重装电脑系统？

发表回复

低代码平台开源（低代码开发平台开源）