12月9日,AI范畴送来一则沉磅动静——智谱正式开源其焦点AI Agent模子AutoGLM。这款被业界誉为全球首个具备“Phone Use”(手机操做)能力的AI Agent,不只能“看懂”手机屏幕,更能像实人一样完成点击、输入、滑动等复杂交互,不变施行外卖点单、机票预订等长达数十步的操做流程。它的开源,或将完全改写AI手机的手艺款式取生态。做为AI Agent范畴的冲破性,AutoGLM的最大亮点正在于其“Phone Use”能力的落地。分歧于保守AI仅能处置文本或简单指令,它能深度理解手机界面的视觉消息,精准识别按钮、输入框、滑动条等元素,并模仿人类操做逻辑完成连贯使命。目前,它已笼盖微信、淘宝、抖音、从动化能力取此前激发热议的“豆包手机”演示八两半斤,让用户曲不雅感遭到“AI替身玩手机”的可行性。
更值得关心的是,智谱此次开源并非“夸夸其谈”,而是供给了一套“拿来即用”的完整根本设备。此中包罗锻炼好的焦点模子、Phone Use能力框架取东西链、笼盖50+App的可运转Demo、针对Android的适配层取示例工程,以及细致的文档取快速上手指南。这种“全栈式”开源模式,手机厂商取开辟者无需从零搭建手艺系统,即可基于AutoGLM快速复现能“自从操做手机”的AI帮手,大幅降低了AI手机的研发门槛。正在手艺的背后,是智谱对AI手机生态的深远考量。过去,AI手机的成长多依赖头部厂商的封锁手艺系统,中小玩家难以参取;而AutoGLM的开源,将鞭策生态从“封锁从导”转向“共创”。无论是手机品牌想为设备添加智能帮手功能,仍是开辟者但愿定制垂曲场景的AI办事(如电商导购、糊口办事),都能借帮这套东西快速实现。此外,项目支撑当地取云端矫捷摆设,用户可自从选择数据处置体例,确保现私取数据节制权牢牢握正在本人手中,这无疑回应了当下用户对AI平安性的焦点关心。从手艺许可看,AutoGLM模子采用MIT和谈,代码以Apache-2。0和谈托管于GitHub(示例仓库:zai-org/Open-AutoGLM),这意味着利用者不只能间接挪用,还可点窜、二次开辟,以至“改得涣然一新”——只需能帮力实现“AI原外行机”的愿景。这种极致的性,或将激发更多立异可能:大概将来,我们的手机遇具有更懂习惯的智能帮手,残障人士能通过AI更便利地操做设备,企业也能基于此打制专属的行业处理方案。AutoGLM的开源,不只是一次手艺共享,更是AI手机普及的环节一步。当“Phone Use”能力从尝试室千行百业,当AI取手机的融合不再受限于手艺壁垒,我们离“AI原外行机”的抱负形态,正越来越近。前往搜狐,查看更多。