当前AI工具在处理动态网页交互时存在明显不足。它们在处理DOM交互时消耗大量的token,导致效率低下。例如,用户尝试使用AI工具下载音乐时,可能会遇到困难。在尝试使用gemini工具下载音乐的过程中,用户发现需要多次调用搜索工具,即便给予了WebFetch权限,问题依然存在。这是因为下载的网页需要用户点击按钮后,通过夸克应用进行下载,单纯的网页爬虫无法完成这一过程。用户计划尝试AutoGLM工具,并为此设置了MuMu模拟器和App,以便测试AI的能力边界。用户发现即使通过opencode工具,也无法下载所需内容,这可能是由于缺乏合适的工具或工具调用方式不正确。因此,用户决定转向AutoGLM,并计划创建一系列技能,使opencode能够编写Python脚本,并在AutoGLM目录下执行以启动AutoGLM。这一过程将帮助用户探索AI工具的极限和可能性。

标签: none

评论已关闭