张家辉 - AI Agent又火了 | Alex聊AI
中国人工智能(AI)模型DeepSeek自今年推出以来,才刚开始火热起来不足3个月,国内的另一AI初创公司Monica又冒起来,向全球发布并把通用型AI助理Manus带火了。笔者早前身边已有朋友开始用大模型工具,突然又出现新一个模型,许多人都搞不清楚两者有何区别。其实笔者已经关注了AI助理发展良久,而业界亦非常期待今年在这方面能有所突破。
现时广获市场应用的ChatGPT、DeepSeek,以及内地市场较常用的Kimi、通义等均属于大语言模型(Large Language Model — LLM)。简而言之,其主要功能就是「对话」,并理解我们所输入的内容和提出的问题。至于像GPT-4等更复杂一些的「多模态模型」,则整合了文本、图像和音讯处理能力,使LLM能够以更接近人类的「听」、「说」、「看」等能力。因此,人们在日常使用中,就是打开大模型的App或者网站,并输入其问题,AI便会调用算力,加上互联网搜索,从而给予用户分析和答案。
犹记得电影《铁甲奇侠(Iron Man)》内的AI助手Jarvis就很有智慧,「主人」Tony只需给它一个指令,便能直接执行。现有的AI Agent就像Jarvis,是懂得「执行」的助手,更确切而言,其更像AI智能体。在Manus的发布短片中,AI可以根据指令进行程式设计,甚至能直接封装成安装档案,这无疑比LLM更具有实用性。事实上,目前几乎所有AI大厂都在全力推进AI Agent的开发,其中OpenAI、Google、Microsoft等AI Agent也具备可用性。
另一方面,今年同样火起来的「人形机械人」,在解决了硬体难点后,需搭配AI Agent等软件,方能使机械人根据人的指令,并灵活调用多种工具解决现实问题。这些工具甚至可以包括大语言模型、视觉模型等等,有了AI Agent加持,机械人走进人们日常生活的愿景才能真正实现,以节省办公和前端开发成本和时间。
INTL GENIUS
行政总裁
张家辉


















