与 iOS(WebDriverAgent) 集成
在使用 WebDriverAgent 连接 iOS 设备后,你可以使用 Midscene JavaScript SDK 来控制 iOS 设备。
样例项目
使用 JavaScript SDK 控制 iOS 设备:https://github.com/web-infra-dev/midscene-example/blob/main/ios/javascript-sdk-demo
与 Vitest 集成和测试:https://github.com/web-infra-dev/midscene-example/tree/main/ios/vitest-demo
案例展示
关于 WebDriver 和 Midscene 的关系
WebDriver 是一套由 W3C 制定的用于浏览器自动化的标准协议,它提供了一个统一的 API 来控制不同的浏览器和应用程序。WebDriver 协议定义了客户端和服务器之间的通信方式,使得自动化工具能够跨平台地控制各种用户界面。
在 Appium 团队及其他开源社区的努力下,业界已经有了许多优秀的库将桌面、移动端等设备的自动化操作转化为 WebDriver 协议。这些工具包括:
- Appium - 跨平台移动自动化框架
- WebDriverAgent - 专门用于 iOS 设备自动化的服务
- Selenium - Web 浏览器自动化工具
- WinAppDriver - Windows 应用程序自动化工具
Midscene 适配了 WebDriver 协议,这意味着开发者可以使用 AI 模型对支持 WebDriver 的任何设备进行智能化的自动化操作。通过这种设计,Midscene 不仅能够控制传统的点击、输入等基础操作,还能够:
- 理解界面内容和上下文
- 执行复杂的多步骤操作
- 进行智能断言和验证
- 提取和分析界面数据
在 iOS 平台上,Midscene 通过 WebDriverAgent 连接 iOS 设备,让你能够使用自然语言描述的方式来控制 iOS 应用和系统。


