大模型实现了历史上规模最大的一次知识迁移。

4月25日,由中国科技产业智库「甲子光年」主办、上海市信息服务业行业协会支持的「共赴山海·2023甲子引力X智能新世代」峰会在上海顺利召开!

36位嘉宾齐聚本次峰会,全方位聚焦新一代人工智能,为科技与产业的结合寻找新机会,层层剖析中国科技产业新风向和趋势判断,一起驰骋在智能新世代,共同探寻智能新世代的过去,现在和未来。


(资料图片)

现场,昆仑万维CEO方汉为观众带来了主题为《昆仑万维天工大模型之路及商业化前景》的分享。

方汉认为, 大模型实现了历史上规模最大的一次知识迁移,使得全球任何语言的人都能使用大模型学习和迁移知识。这为海外市场带来了商业机会。

在他看来,由于大模型具有天然的倾向性,每个国家都需要训练自己独有的语言模型。在大模型的军备竞赛中,除了美国,中国参与的公司最多,这对于中国公司来说是一个很好的机会。

与此同时,方汉指出,在全世界范围内,所有大模型都是从容错率高的行业切入,逐渐向容错率低的行业渗透。这一点需要高度注意。

以下是昆仑万维CEO方汉演讲实录,「甲子光年」整理删改:

各位朋友,下午好!我是昆仑万维的CEO方汉。今天我想向大家简单介绍一下我们刚刚发布的“「天工」大模型”,以及我们对商业和前景的思考和探索。

首先,来了解一下我们公司。我们是一家A股上市公司,已经在海外市场发展了十多年的时间。我们的业务范围涵盖了信息分发、社交、娱乐、元宇宙、游戏以及AIGC等多个领域,其中包括通用人工智能与AIGC、海外信息分发及元宇宙和科技股权投资等三大业务板块。我们的市场覆盖了中国、东南亚、非洲、中东、北美、南美和欧洲等地区,拥有4亿月活用户,其中海外收入占比达78%。

我们目前的业务有三大矩阵。

首先是海外信息分发和元宇宙。我们有世界第三大浏览器Opera,我们在海外也与OpenAI展开了全面的合作。因为我们都知道,浏览器是上一代搜索引擎的入口,而下一代将成为通用人工智能助手的入口。我们还拥有一个 Web3 浏览器,我们相信它将成为下一代 AIGC 大潮中非常重要的入口。浏览器市场正在蓬勃发展。

第二是AGI和AIGC。昆仑万维和奇点智源合作自研推出中国第一个真正实现智能涌现的国产大语言模型「天工」。StarX MusicX Lab音乐实验室作为公司人工智能领域重大战略成果之一,目前已具备高效供给高质量AIGC音乐内容的能力,已经实现了通过AI作词、作曲和编曲,创造的歌曲在180个平台公布。

最后还有一个股权投资业务,也就是昆仑资本,我们在这方面投资比较多,可以看到追觅、小马智行等,都是偏高科技与新材料方向。

大家都知道昆仑万维是一家偏重内容的公司,但我们为什么会进入大型模型的领域呢?

其实,这是个巧合。在2020年6月,GPT-3发布时,我们注意到了这个新闻。当时,我是公司的CTO。我们认为GPT-3是人工智能领域的一个里程碑,可以带来整个内容生成领域的重大变革。当时大多数人都没有想到它会成为通用人工智能的一个敲门砖。于是,我们成立了一个团队,与奇点智源合作,跟踪GPT-3大模型。2022年12月底发布了AIGC全系列算法与模型,开源了文本AI、编程AI、绘画AI。今年4月17日,我们正式发布了「天工」大语言模型。

「天工」有多种优势。

比如,支持超过1万字的文本对话,并能实现20轮以上的问答交互,擅长语义理解和文本协作等,在目前已发布的模型中质量相对比较高。

1.大模型对中国是一次很好的机会

国内大模型现在成为一个很大的赛道,大家可以看到垂直赛道、初创型企业、互联网大厂在大模型生态方向有着巨大的发展空间。对于大模型的生态而言,除了国内赛道以外,在全球仍然有很大的空间。

事实上,我想分享的是一个可能被很多人忽视的点: 大模型实现了历史上规模最大的一次知识迁移。 训练文本中,英文占比约为92%。这是因为近两百年来,人类科研、技术成果和智慧大多以英文书写。这对于语种而言是不公平的。

但利用大模型,我们看到知识回答的问题源泉是各种语言的知识,这真正打破了知识垄断,使得全球任何语言的人都能使用大模型来学习和迁移知识。这为海外市场带来了商业机会,也是我们多年耕耘海外市场的心得。

由于大模型具有天然的倾向性,每个国家都需要训练自己独有的语言模型。在大模型的军备竞赛中,除了美国,中国参与的公司最多,这对于中国公司来说是一个很好的机会。

从产业图谱来看,国内的创业公司在数量或质量方面与美国同行相比并不逊色。我认为我们的优势在于两方面:首先,我们的工程师更加勤劳,能够快速跟进最新技术;其次,我们的产品人员在商业模式创新方面更有创造力。我也很期待在「天工」大模型的基础上涌现出更多的基于大模型底座的创业公司,推动各种商业模式的创新。

因为我们已经拥有一个基础大型模型,所以我们现在计划对「天工」大模型的能力进行扩展。我认为大模型本质上类似于CPU或操作系统,我们需要扩展它的能力。

2.大模型创业,这几点需要着重关注

大模型如何发挥能力?我认为需要注意4点:

首先,目前很多人只将大型模型视为个人助手,这只是发挥了其中的逻辑推理能力。虽然当前的大型模型在特定任务上的能力不如专用模型,但我们可以通过通用大型模型来控制多个专用模型。 其次,像ChatGPT一样,通过API接口实现多种功能也是大型模型渗透不同领域的必经之路。第三,我们需要对大模型的数据进行保护,注意数据安全,例如通过联邦计算、隐私计算等方式。第四,所有大模型其实都需要接入搜索引擎,因为大模型存在时效性、准确性的问题。只有有了搜索引擎,人们才能利用人类整个互联网了即时更新的各种信息。

「天工」大模型的发展经历了一段时间的演进。之前,我认为大模型能够更容易地帮助人类完成电脑上闭环的工作,但现在我有了新的认识。

我们最常使用大模型的领域是内容创造行业,包括协作、设计、动画、短视频、影视、广告翻译等。这个行业的容错率非常高,不需要人工干预。可以直接使用结果。

比如,在文生图领域,画手曾是个痛点,画6根手指还是7根手指,其实对结果的影响不大。但是在商业层面,对于金融、医疗、能源法律等领域,除了人工干预外,还需要进行伦理论证和监督,以确保结果不会损害人的利益。最后,在工业制造、航空航天和国防军工方面容错率极低,试错成本特别高。

我认为,在全世界范围内,所有大模型都是从容错率高的行业切入,逐渐向容错率低的行业渗透。这也是「天工」大模型场景的演进趋势,我们也会遵循这个方向开展后续工作。

目前,在实践过程中,我们已经测试了一些比较成熟的「天工」大模型应用场景,主要集中在容错率高的营销传媒、内容创造、教育咨询、游戏文娱、人力资源和数据服务行业。我们也欢迎各界B端用户与我们合作,共同推动大模型在中国的应用,让应用之路更宽、更顺。

最后,我希望大家能够抓住这次大模型带来的商业机会。奇点已到,让我们共赴山海。谢谢大家!

推荐内容