吴恩达押注Agent新作用官宣!零样本符号完成图片方针检测

栏目:媒体动态 发布时间:2025-02-08 10:20:31 浏览量: 1  来源:bob电竞

  举个栗子,在一张长满草莓的图片中,提示词为“未老练的草莓”,AI模型立马分分钟帮你找出。

  据吴恩达介绍,曾经视觉AI要想辨认物体,需要在很多标示数据上练习,而现在AI只需瞥一眼图片,时间短考虑后(其时约20~30s)就能马上输出正确内容。

  现在这个AI东西人人免费可玩(也为开发者供给了API),仅曩昔几小时,一网友试玩已新鲜出炉~

  传统视觉AI的方针检测,常常要制作很多边框来标示数据,然后在神经网络上练习。

  而现在,新的AI体系将耗时耗力的标示进程省掉了。它将感知规划举动等都糅合在一起,经过调用一系列东西,以及对使命长度进行推理,终究完成了零样本符号输入输出。

  按他的说法,这就比如“睁眼版”o1和DeepSeek R1,看一眼,然后当即考虑作答。

  介绍进程中,除了一开始说到的草莓辨认,他还展现了其他几个demo(请大家来找茬doge)。

  当然更有用的场景是,假设在家里翻箱倒柜找不着东西了,呼唤它来协助(妈妈:别整天妈妈妈)。

  当然,还有相似下面这样的日常日子。AI成功找到了一大盘食物中的寿司,不过在找货架上的汽水时,网友反应只要具体到芬达这个品牌名才有时机成功,单纯提示“汽水”nonono。

  同一张图,当网友企图找出戴帽子的人,AI显着漏了,一眼就能看到23号队员。

  经网友总结,明显Agentic Object Detection对一些遍及的问题(如遮挡、光线过曝等)还无法杰出习惯。

  正如咱们前面说到的草莓,有火眼金睛的网友发现,AI误将一个光线欠安的老练草莓辨认为“未老练”。

  不过吴恩达也早已说到,现在这个还仅仅开始测验,查验测验质量、答复速度等后续还会进行优化。

  众所周知,吴恩达从2017年脱离百度后(百度前首席科学家)便投身AI创业。

  2017年6月,他官宣了第一个创业项目Deeplearning.ai,主要和教育相关(他现在仍是斯坦福大学CS客座教授)。

  这是一个AI在线教育渠道,经过供给深度学习课程和资源,协助人们学习AI技能。

  在这之后,他又推出了第二个创业项目Landing.ai,专心于帮企业完成人工智能转型。

  从其时的介绍来看,其方针是经过AI技能进步企业功率,处理制造业中的痛点问题。例如进步出产功率、优化供应链办理、削减糟蹋等。

  后来Landing.ai还和富士康等企业建立了战略协作伙伴关系,共同开发AI技能、人才和体系。

  也几乎是一起,他在2018年景立了第三个创业项目AI Fund,明显这是一家专心于出资人工智能草创企业的出资基金。

  其时资金规划到达1.75亿美元,出资者包含NEA(New Enterprise Associates)、红杉和软银等一众闻名组织。

  其时他就说到,就像大言语模型(LLMs)在零样本形式下作业(提示模型逐一生成终究输出token,而不修正其作业),Agent在履行一系列过程(如规划、履行、反思等)后或许比单次发生更好的作用。