在应用场景方面,该模型特别适合与计算机智能体配合使用。模型接收屏幕截图与自然语言指令后,可输出目标 UI 元素的标准化边界框坐标,随后由其他智能体模型完成点击、滚动等交互操作。目前该模型已经在 huggingface 开源。
This Tweet is currently unavailable. It might be loading or has been removed.
,推荐阅读PDF资料获取更多信息
第114期:《求购OpenAI股份;转让Animoca Brands、Discord股份专项基金LP份额|资情留言板第114期》
15 hours agoShareSave