张家辉 - AI Agent又火了 | Alex聊AI

张家辉

2025-03-24 02:00 HKT

阅讀更多

內容

　　中国人工智能（AI）模型DeepSeek自今年推出以来，才刚开始火热起来不足3个月，国内的另一AI初创公司Monica又冒起来，向全球发布并把通用型AI助理Manus带火了。笔者早前身边已有朋友开始用大模型工具，突然又出现新一个模型，许多人都搞不清楚两者有何区别。其实笔者已经关注了AI助理发展良久，而业界亦非常期待今年在这方面能有所突破。

　　现时广获市场应用的ChatGPT、DeepSeek，以及内地市场较常用的Kimi、通义等均属于大语言模型（Large Language Model — LLM）。简而言之，其主要功能就是「对话」，并理解我们所输入的内容和提出的问题。至于像GPT-4等更复杂一些的「多模态模型」，则整合了文本、图像和音讯处理能力，使LLM能够以更接近人类的「听」、「说」、「看」等能力。因此，人们在日常使用中，就是打开大模型的App或者网站，并输入其问题，AI便会调用算力，加上互联网搜索，从而给予用户分析和答案。

　　犹记得电影《铁甲奇侠（Iron Man）》内的AI助手Jarvis就很有智慧，「主人」Tony只需给它一个指令，便能直接执行。现有的AI Agent就像Jarvis，是懂得「执行」的助手，更确切而言，其更像AI智能体。在Manus的发布短片中，AI可以根据指令进行程式设计，甚至能直接封装成安装档案，这无疑比LLM更具有实用性。事实上，目前几乎所有AI大厂都在全力推进AI Agent的开发，其中OpenAI、Google、Microsoft等AI Agent也具备可用性。

　　另一方面，今年同样火起来的「人形机械人」，在解决了硬体难点后，需搭配AI Agent等软件，方能使机械人根据人的指令，并灵活调用多种工具解决现实问题。这些工具甚至可以包括大语言模型、视觉模型等等，有了AI Agent加持，机械人走进人们日常生活的愿景才能真正实现，以节省办公和前端开发成本和时间。

INTL GENIUS
行政总裁
张家辉