这次,引领者又是中国公司!在5月中旬拿到GAIA榜首的这个AI版office,直接结合了Deep Research和通用Agent两大神器的优点,从此office三件套彻底进入第四代。
前段时间,GAIA榜单再被刷新,又一个中国公司登顶了。


没错,它就是昆仑万维的天工超级智能体(Skywork Super Agents)。
可以不夸张地说,AI版office来了,Deep Research的内容质量,再加上通用Agent的多模态输出,简直让人不敢相信。
从此,打工人的工作流,将颠覆性升级。
话不多说,Show me the Code!
超能Office「六件套」
实测一波之后,只能说Skywork Super Agents真的太惊艳了,完全就是想象中「智能体」的样子。
首先是他们支持的模式非常多,几乎涵盖了「打工人」日常能够想到和用到的所有场景,而且其中有几个场景运行起来真的是那种「科幻般」的效果!
你懂吗,就是钢铁侠和贾维斯互动那种感觉。

全球官网:https://skywork.ai
中国官网:https://tiangong.cn
PPT智能体:省时高效,轻松完成
第一个就测试打工人必备,日常工作使用最高频的PPT模式。比如如果想将《金融时报》介绍LLM原理的一个动态网站——这是一个非常复杂的动效网站——转化成一个PPT。

先来看下Skywork工作台的最终效果,左边是Agent的思考流程,右边是最终的结果展示,可以看到PPT最终的完成度非常的高。

并且还给每一个信息都标注了「溯源」标签,可以找到内容的原始出处,极大概率地减少了大模型的「幻觉」问题。

然后我们再仔细拆解一下Skywork是如何实现的这个过程的。
可以看到,它非常好的一点是,在任务开始前会进行充分的思考。
比如提前分析需要哪些信息,确认内容主题,确认PPT内容类型以及PPT的风格,尤其是把这个过程设计了精美的UI界面,非常方便点选操作。

在确认内容后,它就会制定自己的「行动指南」,通过将执行步骤原子化,来保证整个流程的顺畅。

然后,你就可以倒一杯咖啡,静静地看着Skywork为你工作了。

看看最终成品这效果,可以说是相当专业了。
要知道,在这个任务中,我们没有提供除了网站之外的任何信息,所有的这些都是Skywork自己「开脑洞」做出来的。




文档智能体:智能创作,效率倍增
试完了PPT,再来看下文档模式。
日常工作中,每天几乎都要被领导安排各种各样的调研和写稿任务,使用下来发现,Skywork在文档模式里简直就是我们的贾维斯。
比如老板安排我们去调研一下OpenAI过去10年来是如何发展的,这如果是过去依靠搜索引擎简直就是一头雾水。
但是用上Skywork后,也就是一杯咖啡的时间。

首先,依然是标志性的任务确定环节。
这次它帮我们起了三个参考题目,并提前确定了要关注的发展阶段和内容侧重点,最后还给出了叙事角度。

生成结果后,还支持多种格式的导出,甚至可以单独将这个网页分享出去。
更「贴心」的是,你可以在分享前,通过代码编辑功能,直接修改内容。


最后,来看下「写」的怎么样。



不论是从内容的严谨程度,还是排版的精美程度上,Skywork真的让我们感受到AI的力量,堪比一份专业的分析报告。
要知道,完成这个任务需要收集长达10年的数据,而它也就用了十几分钟便做好了。
最后的结语也写得格外浪漫,无论是标题还是正文,都像是一封写给未来的「情书」,点燃了人们对AI时代的无限想象。

值得一提的是,它还整理了一份OpenAI的重要时间线,同样是完全的准确。

表格智能体:自动收集,高效处理
办公三件套除了PPT和Word,还剩下Excel。
比如大部分人都知道奥特曼,但是大部分人无法说出全部的奥特曼角色名称,看看下图,看着就头痛,这次让我们整个活,试试Skywork能不能搞定这些名字。
注意,我们并没有上传这张图片,而是完全依靠它自己的联网能力来搜集信息。

没想到,在最初的任务确认阶段,就让人眼前一亮——
它不仅知道和奥特曼相关的其他角色类型,甚至还点出了时间范围,简直就是个动漫通。

最后输出的Excel着实让我们感觉这个智能体「强得有些过分」。
首先它生成了6个sheet列表,每一个都对应了不同的统计口径。
比如下面这两张图,就分别是不同时代的奥特曼角色统计,以及奥特曼角色的年代变化趋势。


除了一般性的统计,还有正反角色对比分析,甚至还有图表分析,并且图表还做好了与表格的关联。
看来以后很多数据整理的工作任务都可以用Skywork先出个基础的Excel分析报告了。


网页智能体:分钟级搭建一个网站
一键生成网页,Skywork也不在话下,就拿当下比较火的AlphaEvolve举例,这是谷歌近期发布的最新编程智能体。

我们直接和它说:「根据这个AlphaEvolve的白皮书,生成一个介绍网站,要求网站内容准确,UI设计好玩,科技感。」
然后不到一杯茶的功夫,一个官网介绍页面就做好了。

可以看到,这个网站的完成度相当的高。
首先是技术原理页面。

然后是应用场景页面。

最后是案例展示,看得出Skywork确实「亲自」看过AlphaEvolve的白皮书才能总结出这些案例。

不仅如此,我们还可以制作一个类似马里奥的网页游戏。

最终的游戏效果,不论是画面的自动前进,还是跳跃的碰撞判定,都相当厉害。
要知道,这是Skywork根据一句话用了十几分钟生成的。

并且,你还可以通过继续对话,来修改网页,比如上面的游戏角色跑的有点快,就可以直接和Skywork说「前进速度慢点」。
你会发现角色的前进速度明显变慢。
这不就是AI时代编程应该有的样子嘛!

播客智能体:一键找资料写稿录制
Skywork还能一键生成播客节目,不过目前还只能选择英文。
比如我们想听听关于麦当劳的一些发家史,就可以直接和它说,它会在查询资料帮你制作一个聊麦当劳的播客节目。

通用智能体:海量工具完成各种任务
在普通模式里,现在已经接入了十余个MCP,包括网页搜索、图片/视频生成、音乐生成等等。
而这些工具混合后,我们就能得到一些酷炫的产物,比如MV、宣传片、有声书、绘本……
比如我们现在让《清明上河图》的人物动起来,还能配上合适的声音。
这个智能体,可太全面了
光听上面的介绍,你是不是觉得就够震撼了?
又是Deep Research,又是office,又是智能体,实在是要素太多了。
没错,Skywork Super Agent不同于以往任何一种你见过的AI产品。
它的诞生,就是为了颠覆整个AI产品市场。
它的野心,是单挑Deep Research、智能体和垂直工具领域,一次全部横扫。
而且,相比于通用AI智能体,它克服了此前的痛点,做到了更专业,更聪明,性价比还更高。
可以说,Skywork是真正「有用、敢用、好用」的AI智能打工人。
什么样的产品,敢喊出这样的口号?那就让我们逐项掰扯掰扯。
六大卖点,亮点十足
首先,这是国内首个可用的Deep Research服务,可以直接对标OpenAI的同名产品了。
输入同样prompt,它搜索的材料是其他智能体的十倍,能提供专业级、科研级、咨询级的内容质量。
第二,它有五种模态,各种形式一应俱全,能节省你90%的工作时间!
第三,就是结果让用户敢用。
其他的智能体,还只能甩出结果,可不可信可就不知道了。
但Skywork产出文档、PPT、网页,都是带溯源的,能标记到来源材料的原始位置,避免大模型幻觉,让交付成果真正可用。



输出物的文本能关联到原文的某段落;图片也可以标记出溯源网页/知识
此外,它生成的结果,都可以在线编辑,很多都支持导出为本地文件。
它还提供类似NotebookLM的功能,让我们可以构建私人知识库。
最后一条,就是给开发者的福音:它提供了全球首个开源的Deep Research Agent框架!开放生成文档、表格、演示文档PPT的三个MCP,都可供开发者调用。
Deep Research Agent框架开源:
https://github.com/SkyworkAI/DeepResearchAgentMCP地址:
https://mcp.so/server/skywork-super-agents/Skywork-ai
自研打出差异化,五大硬核实力
背靠一系列自研尖端技术,Skywork Super Agent得以实现超越,成为AI智能体中最亮眼的一款。
具体来说,主要有以下五大差异化技术优势。
1. 自研Deep Research模型
基于深度思考和推理能力,Deep Research模型彻底革新了传统信息检索方式。
传统搜索,主要依赖关键词的匹配,容易遗漏深层信息。
而昆仑万维团队通过强化学习,增强了模型搜索泛化性,大幅提升了检索的广度、深度和效率。
其搜索能力对标OpenAI Deep Research,为用户提供高质量的源信息。
无论是生成研究报告,还是PPT,自研的Deep Research模型都能提供专业级、科研级素材,确保了内容广度和深度,大幅提升检索效率。
2. 自研Agent Workflow框架
团队还开发了独特的Agent Workflow框架,用于高效信息传递、任务拆解,以及基座大模型调用。
一般来说,AI智能体在处理多模态任务时,容易因任务复杂性,导致效率低下。
Agent Workflow框架最大作用,便在于智能分解任务和上下文管理,将复杂任务拆分为可控子任务,然后交由专门的智能体处理,确保高效协同。
也就是说,用户一个指令,框架就能自动将任务分配给文档、表格等智能体,极大地节省了时间。
这一框架,在开源Deep Research榜单中拿下了SOTA。
3. 自研生成物模型
通过高质量数据生产、收集和训练,团队研发了一款「生成物模型」,能够提升生成物丰富性,内容真实性和可读性。
4. 信息溯源、反思检查
AI幻觉是大模型的普遍痛点,可能直接导致生成虚假信息。
为此,昆仑万维团队构建了信息溯源、反思和检查的工作流,让所有输出内容,可追溯到可信来源。
这样一来,用户无需担心内容真实性和可信度,有效避免了AI幻觉的问题。
5. 自研在线编辑系统
对于打工党来说,办公福音来了。
昆仑万维的在线编辑系统兼容主流办公软件,支持一站式文件生成和修改,并且成片能够一键导出。
也就是说,任何人都能收获到所见即所得的编辑体验。
此外,Skywork还支持将复杂任务拆分为多个独立子任务,在每个子任务内进行Deep Research,并保持上下文隔离,从而突破模型上下文长度的限制。
对于超复杂任务,不论是撰写百页研究报告,还是生成多场景营销方案,它都能高效完成。
智能体爆发前夜,中国AI突围
当前,智能体市场正处于爆发前夜。
根据行业报告,AI智能体市场将从2024年的51亿美元,跃升至2030年471亿美元,年复合增长率达44.8%。

这一爆发式增长,源于智能体在多个场景中的应用普及,包括职场办公、学生研究、创意生产等等。
OpenAI凭借ChatGPT的先发优势,在智能体领域持续领跑。
今年2月初次亮相的Deep Research,凭借强大的深度搜索+推理能力,深受用户喜欢,被广泛用于学术研究与行业分析中。
不过,其高昂的定价(月费200美金)和封闭生态,限制了其市场渗透率,尤其是个人用户。
谷歌依托Gemini模型,同样推出Deep Research功能,并整合了搜索与自家的Workspace生态,瞄准了企业级市场。
其优势在于全球搜索用户,企业用户庞大群体,因此在整体定位上偏通用,缺乏针对办公场景的深度优化。

反观国内,许多初创公司和科技大厂纷纷加入战局,诞生了一批响彻海外的通用智能体,如Manus、Genspark等。
整体来看,2025年,AI智能体市场呈现出「巨头主导,新兴突围」的格局。
OpenAI谷歌等巨头凭借技术与品牌优势,预计占据超50%市场份额。其他玩家可瓜分剩余份额,竞争焦点主要聚焦在:搜索能力、复杂任务处理、性价比、内容可信度。
Skywork Super Agent精准填补了市场空白,成为2025年智能体赛道的黑马。
它的发布成为昆仑万维全球化战略的新里程碑,性能直接对标OpenAI,登顶GAIA榜单,冲击Product Hunt日榜第一。
此外,开源Deep Research框架将会赋能全球开发者,进一步推动全球AI生态繁荣。
在智能体市场的群雄逐鹿中,Skywork不仅是产品,更是这家公司引领AI未来的宣言。
以技术为剑、市场为盾,昆仑万维正书写中国AI的传奇。
参考资料:
https://www.tiangong.cn/
本文来自微信公众号“新智元”,作者: HYZX ,36氪经授权发布。