HCompany 近日推出了全新的 Chrome 扩展程序 HoloTab,旨在利用先进的“计算机使用型”(computer-use)人工智能技术实现网页任务自动化。该工具可直接集成到浏览器中,用户无需具备任何技术背景,即可实现跨多个网站的复杂工作流自动化。
该扩展程序采用了 HCompany 的 Holost3 模型,这是一款于 3 月 31 日发布的高性能计算机使用型 AI。根据 huggingface.co 的相关报告,该技术能够像人类用户一样,通过自主导航界面、填写表单并做出决策来完成任务。
该公司在发布公告中表示:“我们打造了全球最强大的计算机使用型 AI 之一,并让用户可以直接通过浏览器调用它。”
网页自动化常规任务
HoloTab 的核心功能之一是其“常规任务”(routines)功能,专门针对重复性的数字化任务。用户可以进行实时动作录制,通过语音解说并演示点击界面的过程,从而展示特定的工作流程。
录制完成后,系统会自动生成一个可重复执行的任务流。随后,该软件可以重新运行这些任务,或者按照预设的时间表处理数据密集型流程,例如对比竞争对手的价格或监控招聘网站的动态。
在录制阶段,HoloTab 会同时捕捉屏幕动作和用户上下文信息,以理解任务的最终目标。这使得 AI 代理能够自主管理长周期流程,例如更新主电子表格或管理申请跟踪文档。
尽管这项技术主要面向专业生产力场景,但开发团队表示,该工具的设计初衷是面向广大用户。系统会自动处理底层的视觉模型和动作规划,用户只需接收最终的处理结果即可。