2024年AI圈最火关键词Agent:从OpenAI到智谱AI的多终端Agent产品
系统开放),适用于解放打工人双手的生产力工具,手机也能远程操作电脑打工人今天还升级了,本事妥妥地见长。则在电脑端提供了更多面向职场场景的功能体验。系统的新人,你多少会因为系统的变化弄到手忙脚乱。采访时表示,预训练肯定还要继续,但对于算法和数据的训练会有一套新的逻辑。
2024年,AI圈最热门的关键词非Agent莫属。
从简单的 GPT 到可以自主行动的用途,再到最近 AI 初创公司 /dev/ 凭借其 Agent 操作系统估值达到 5 亿美元,制造商正在努力寻找 AI 的下一个明确方向。
在中国,上个月智浦AI也带来了自己的答案——。
如果你拿出手机,打开应用程序,点击搜索,输入关键词……通常需要四五个步骤才能完成这些操作,但有了人工智能,这些操作就变成了一句话的事情。
如今,智普AI还在北京推出了覆盖多终端的系列代理产品。
用户只需输入指令,GLM就能理解指令,规划任务,然后识别界面中的窗口、图形、文本等,实现自动化操作,就像AI接管设备进入航海时代一样。
在Agent现场,智浦AI CEO张鹏通过面对面的建群方式,向数百名参会者发送了微信红包和网络密码红包。如果你有收到红包的朋友,请在评论区分享你的喜悦吧。
:移动端(暂开放),可独立进行50步以上的长步操作,适合比价、导航、超级通话等复杂操作。
GLM-PC:PC版(暂时对Mac系统开放),适合解放工人双手的生产力工具。手机还可以远程操作电脑。
-Web:网页版,支持百度搜索、知乎等数十个网站的无人驾驶。
最形象的注脚恐怕就是从Chat到Act,AI无处不在,但Agent也无处不在。也就是说百度网站优化,从为我们“想”到为我们“做”,Agent正在重新定义智能设备。
别人的AI只是聊天,而这些AI却可以帮我钓鱼。
AI帮我钓鱼?让我躺下用超级留言买咖啡
在之前的文章中,我们已经体验过智能手机如何接管我们的手机。
全自动发微信、浏览淘宝……以前必须自己做的事情现在都解决了。而且,这个AI工作者今天升级了,而且非常擅长做事。
我们也提前体验了这些最新的AI工具。
我们的消费观念是,贵的东西可以买,但不能买贵的东西。
比如,不久前,《人类简史》的作者尤瓦尔·赫拉利出版了他的最新著作《超越智人》。那我为什么不让AI帮我浏览一下拼多多和淘宝,看看在哪里可以找到它们呢?很划算。
我只需要动动嘴,AI就会帮我跑,打断腿。不过仔细一看,书名还是有一点点混淆的瑕疵。
如果在嘈杂的环境中说话有困难,请不要担心。
它还配备了“静音模式”,可以通过打字来下达命令,并且在执行任务之前,还给用户3秒的“后悔时间”,以便可以随时停下来调整任务的执行。
追星族有个好消息,全新升级的连朝花可以听懂签到打卡了。
以李兴良的超级通话签到为例。我只需要在浮动窗口中输入我的指令,AI就会为我完成整个过程。遇到敏感信息只需“现身”,一键告别“误报”。的焦虑。
对了,你还可以为这些日常任务设置快捷命令,一键完成。
不要低估这个功能。作为一名职业工作者,下午定期点的咖啡堪称“维持生命的工具”。您无需每天一次又一次地进行设置。你只需要保留点咖啡的说明就可以了,省了很多力气。
选择休闲模式,让AI全程为你做决策,打开咖啡盲盒。但当涉及到发送、下单、支付等重要操作时,选择权会主动交还给您。
跨应用协作是本次升级的一大亮点。
苹果AI向我们展示了系统级AI打通应用墙的重要性,现在借助它,我们也能实现类似的效果。比如我让AI在小红书里搜索大蒜白菜的教程,并成功转发。朋友圈。
新的AI导航功能也非常实用。想去广州塔吗?只要轻声说几句,AI就会为你安排清楚。
不幸的是,仅支持系统。
不过,智浦也将从即日起放开用户内测额度,进一步优化功能和用户体验。预计尽快推出,成为真正向广大C端用户开放的产品。
智浦轻言-Web插件今日也新增在线功能。
据悉,-Web支持百度搜索、微博、知乎等数十个网站的自动驾驶。
在官方演示中,-Web自动完成“百度搜索芒果TV,打开再见情人,播放最新剧集,发表评论”。整个过程没有用户干预。
▲图像。图片来自:xxx
从手机到电脑,让AI为我当工人
相比之下,GLM-PC在电脑端为工作场景提供了更多的功能体验。
GLM-PC目前是为配备M系列芯片的Mac电脑设计的,其中最推荐的是M1和M3系列设备。在对话框中输入您要执行的操作,GLM-PC 将评估该工具并决定操作计划。
当然,遇到敏感操作时,GLM-PC会自动暂停,等待用户操作或确认。
想了解B站热门内容吗? GLM-PC会用三遍、五遍、两遍的方式帮你找到第一个“进入必刷网站”,为你节省大量漫无目的地划水的时间。
想约张三见面吗?把发微信消息的事情交给AI吧。即使页面被屏蔽,也能在微信搜索框中精准定位。
它还可以帮助您预订腾讯会议并向与会者发送会议邀请。建议工作完成后,收藏这套《操作秘籍》,通过工作流程提高工作效率。
作为一名编辑,我个人最喜欢的功能就是让它帮我整理海外AI新闻。发出命令后,AI会打开浏览器,输入网址,得到清晰的新闻摘要。
顺便说一句,如果你是一个刚刚从Win系统切换到Mac系统的新人,你会因为系统的变化而有些困惑。
现在GLM-PC就是您的“救命稻草”。无论是调整显示模式还是其他设置,将您的所有需求交给它。麻烦的事交给AI,快乐留给自己。这才是人生的正确取胜之道。
GLM-PC还有一个堪称“炸弹王”的功能。
首先在GLM-PC设置中开启“暂停模式”,然后通过手机上的验证码登录“”。您的手机甚至可以远程控制计算机。
具体来说,您可以远程向GLM-PC发送命令消息,让GLM-PC执行计算机操作。 GLM-PC每执行一个步骤,都会返回该操作的屏幕截图。如果有敏感操作,会等待用户确认后再进行操作。
现场演示时,张鹏还通过手机上的GLM-PC网页发出指令,并在电脑上通过微信成功发送文件。
事实上,当AI开始真正“干活”而不仅仅是“说话”时,也标志着AI应用进入了“脚踏实地”的务实阶段。可以说,当AI真正开始解决日常琐事时百度网站优化,它将从一个玩具转变为真正的生产力工具。
这或许才是AI技术应该有的样子。
电话使用时间
近两个月来,手机行业密集发布了多款新品。有一个趋势值得关注。虽然AI手机尚未得到消费者的广泛认可,但系统级AI已成为各厂商操作系统的亮点。事实上,这也是一种趋势。这是Agent普及的先兆。
无论是vivo的蓝心V和发布会上可用于AI点餐的“手机GPT”,华为鸿蒙的小艺和 ,还是荣耀的YOYO智能代理,它们本质上都与小米发布的Agent相同。今日智浦:
让AI模仿人类的计划-执行-检查-行动(Plan-Do-Check-Act)循环,像人类一样操作设备。
正如智普AI CEO张鹏在今天的发布会上提到的,目前的Agent能力更像是在用户和应用之间增加了一个智能调度层,链接所有应用甚至所有设备。
这可以看作是大模型通用操作系统LLM-OS的雏形。志普也把这套Agent交互称为GLM-OS的构建,它将对人机交互的形式产生很大的影响。
创始成员、AI技术大师也多次谈到大语言模型操作系统(LLM OS)。他认为大模型在一定程度上是一种新的计算机和操作系统,它可以连接各种软件和硬件,以及由所有模态信息组成的外设,并通过函数调用来执行各种任务。
在传统的操作系统中,需要围绕CPU构建一堆外设,比如鼠标键盘、磁盘存储、缓存空间等。
在LLM OS中,大模型本身就是中央处理单元。 I/O外设不再是鼠标和键盘,因为LLM可以兼容更多模式的数据输入和输出。同时,大模型调用的外部工具也将从传统软件升级为智能代理工具。
其中,跨应用操作是非常关键的一环,这意味着Agent可以实现更加复杂的自主连贯操作,也可能走向真正的商业化。
我们年初判断,大机型将成为智能手机新的操作系统,自然用户界面(user,NUI)将逐渐取代现有的图形用户界面(GUI)。
至于各个互联网公司提供的服务能否互联,这可能是未来实现这种交互的最大障碍。但无论是智能手机还是应用程序,最终都将是人类发展史上的一个阶段性产品。
当前代理交互仍处于早期阶段。在行业法律瓶颈的背景下,Agent如何成为真正的生产力工具,承担更高比例的工作决策?
智普技术负责人刘晓在接受APPSO采访时表示,预训练肯定会继续,但算法和数据的训练会有一套新的逻辑。
智普AI CEO张鹏也向APPSO表示,团队相对看好Laws的空间,希望在新的范式和生态中探索更多的可能性。
今年,不少厂商不约而同地用自动驾驶来形容AI终端的智能化,并且还将AI分为5个级别:L1-L5。
与其他人不同的是,智普将大模型开发的五个阶段定义为:L1语言能力、L2逻辑能力(多模态能力)、L3工具使用能力、L4自学习能力、L5科学规律探索能力。
张鹏认为,大型模型已经初步具备了人类与真实物理世界交互的部分能力。 “Agent将极大提升L3使用工具的能力,同时开启L4自学习能力的探索。”
从电话使用、使用、汽车使用到All Use,大模型的思维能力和Agent交互逐渐影响我们使用智能设备的方式。
让AI发微信、点赞现在看来实际意义有限,但就像它下棋有多厉害一样,不会对社会产生太大影响。人工智能可以预测几乎所有蛋白质的结构,有助于大量疾病的治疗和研究。
其背后的范式变革是驱动人类生活方式更新的杠杆。 Agent让大模式从Chat走向Act,所谓AI终端的形态逐渐显现,而不仅仅是命名上的改变。