使用 JavaScript 优化 AI 自动化代码
许多开发者喜欢使用 aiAct 或 ai 来执行自动化任务,甚至将所有长段落复杂逻辑描述在一个自然语言指令中。这是很"智能"的做法,但在实际使用中可能遇到无法稳定复现、速度偏慢的问题。
本文为你介绍一种使用 JavaScript 和结构化 API 编写自动化脚本的思路,供开发者参考。
使用 JavaScript 和结构化 API 编写自动化脚本
Midscene 提供了结构化 API 方法,如 aiBoolean aiString aiNumber,用于提取界面上的状态。结合这些方法和即时操作方法,如 aiTap aiInput aiScroll aiHover 等,开发者可将复杂逻辑拆分为多个步骤,以提升自动化代码的稳定性。
简单的例子
以这个原始提示词为例:
通过组装结构化 API,你可以将原始提示词转换为更可靠、更易于维护的代码:
很显然,修改代码风格后,整个过程更可靠和易于维护,开发者可以用传统调试手段控制其中的执行流程。
复杂的例子
以下是修改前的代码:
使用结构化 API 后,开发者可以将这个流程固定为代码:
常用的结构化 API 方 法
aiBoolean - 条件决策
- 适用场景:条件判断、状态检测
- 优势:将模糊描述转换为明确的布尔值
举例:
aiString - 文本提取
- 适用场景:文本内容获取
- 优势:规避自然语言描述的歧义性
举例:
aiNumber - 数值提取
- 适用场景:计数、数值比较、循环控制
- 优势:保证返回标准数字类型
举例:
aiQuery - 通用数据提取
- 适用场景:提取任意数据类型
- 优势:灵活的数据类型处理
举例:
即时操作方法
Midscene 提供了一些即时操作方法,如 aiTap aiInput aiScroll aiHover 等,它们也常用于自动化代码中。你可以在 API 页面查看。
选用 aiAct 与结构化代码,哪个才是最优解?
没有标准答案。这取决于模型的能力、实际业务的复杂度。
一般来说,如果出现了以下现象,你应该考虑放弃 aiAct 方法:
aiAct在多次重放后,成功率不满足需求- 反复调优
aiAct的 prompt 已经让你感到疲惫、耗费了太多时间 - 需要对脚本进行单步调试
想要轻松编写结构化代码?
如果你觉得上述 javascript 代码很难写,那么现在是时候使用 AI IDE 了。
使用你的 AI IDE 索引我们的文档即可:
- https://midscenejs.com/use-javascript-to-optimize-ai-automation-code.md
- https://midscenejs.com/api.md
关于如何将 Midscene 文档添加到 AI IDE,请参考 这篇文章。

