3 k5 I( W& _* }+ N5 N5 S该系统展示了一些令人印象深刻的派对技巧。将你凌乱的手写购物清单的照片交给它,它不仅会使用 GPT-Vision 来阅读它,而且实际上会从你喜欢的杂货店订购所有东西。 a0 G! B' {2 s
$ m0 g) D0 s K1 b# V( M G, i+ sOpenAI 已与多家公司合作,以确保其平台上的顺利运行。6 ?# U% I1 Q# H$ R5 o8 d |. T
. A" s4 p9 R$ W) c6 X
当预订乘车或点餐时,人工智能可以毫无问题地导航 Uber 和 DoorDash 等服务,因为它已预先配置为了解这些服务的界面。 ( R1 Y( f' S: i9 x/ \9 ~! l) [$ @! a3 T+ F3 i
但是,对于不受支持的网站,系统仍然尝试使用其浏览器控制功能来完成任务。这就是 Operator 击败其他替代方案的地方。; a1 R2 g: i# E3 w
# b _. X/ y$ D. f像往常一样,OpenAI 分享了一些基准:它击败了其他最先进的模型,在 OSWorld(处理标准操作系统的熟练程度)上得分为 38.1%,而最佳竞争对手的得分为 22%,在 WebArena 上得分为 58.1%(处理 e - 商业网站),而竞争对手则为 36.2%。. o' r8 o& z! x; S
# o7 I4 Y! X! w2 v; {也就是说,该团队强调 Operator 仍处于研究预览阶段,因此预计会出现错误和错误。1 T% A: J6 v. ^. b0 V& E