近日,腾讯股价波动引发市场关注,然而,该公司却在背后默默发力,推出了名为AppAgent的新一代AI研究。AppAgent是一款能够模拟人类使用手机APP操作的机器人,其独特之处在于采用了多模态智能体技术,结合GPT-4V的视觉理解能力,使它能够像人类一样通过视觉识别和理解界面,进而模仿人类的操作习惯。
在实验中,AppAgent成功地在10款不同的APP上执行了50种操作,包括在谷歌地图中设定导航路线、在Gmail中撰写并发送邮件以及在Lightroom中进行图片编辑等。更令人惊讶的是,AppAgent的学习过程与人类极为相似,从尝试不同按钮的功能到观察他人的操作示范,再到创建针对特定APP的操作指南,这一过程几乎完美复刻了人类学习使用智能手机的过程。
腾讯的这一突破不仅预示着未来用户在使用APP时可能会变得更加便捷,无需繁琐的点选操作,只需简单指令即可实现复杂功能,同时也暗示着类似王者荣耀、原神等需要复杂操作的游戏或许也将被AppAgent所驾驭。
腾讯此次的研究成果表明,大模型的真正潜力并非局限于模型本身,而在于如何将其应用于实际场景。AppAgent正是这一理念的体现,它并未纠结于底层模型的技术细节,而是直接利用GPT-4的强大能力,开发出具有实用价值的智能助手。
此外,腾讯作为一家拥有庞大社交平台资源的互联网巨头,其在微信、QQ等平台上的布局也为AppAgent的未来发展提供了无限可能。AppAgent就像是用户的数字分身,能够在用户不愿或无法亲自操作手机时接管控制权,实现所谓的“自动驾驶”手机体验。
当前市场上已有不少手机厂商和电脑厂商宣称他们的产品具备AI功能,但真正能够像AppAgent这样自动操作APP的产品才称得上是AI手机。未来,AppAgent类智能助手的出现可能会彻底改变APP的操作方式,甚至影响应用开发逻辑,从而引领一场全新的智能应用革命。
腾讯悄然发布新AI研究,AppAgent引领智能应用新时代
对于腾讯而言,人工智能时代的到来无疑是一次新的挑战。过去,QQ和微信分别代表了腾讯在互联网和移动互联网时代的辉煌成就。如今,面对AI革命的浪潮,腾讯能否再次把握住机遇,将决定其在未来的地位。希望腾讯能在保持开放性的同时,充分利用自身的平台优势,推动AI技术的创新与应用,为用户带来更多价值。
本文主题词: