布局“全市算力一张网”!大模型“算”出青岛未来
青岛
青岛 > 要闻 > 正文

布局“全市算力一张网”!大模型“算”出青岛未来

“你看,我只需要一个指令,就能获取青岛市近十年来的GDP数据,并且自动绘成图表,为我生成分析报告。”在青岛大学科学技术学院教授孙仁诚的办公室里,他颇有兴致地向记者展示着团队研发的技术成果。这类成果正是2023年以来风生水起的人工智能大模型(以下简称大模型)。

很少有一项技术像大模型这样,尽管已在全球“热”了快两年,但仍然不断涌现新热点。孙仁诚表示,大模型像当初的互联网技术一样,催生着新一轮技术创新与产业变革。“当前市场以基础大模型为主,如何将大模型融入千行百业,是下一阶段的发展重点。”

2024年5月底,在青岛市算力发展大会上,青岛市工业和信息化局发布的《青岛市人工智能产业创新发展行动计划(2024—2026)》提出:青岛将实施算力设施“强基”、算法模型“铸魂”、数据要素“提质”、核心产业“固链”、创新平台“领航”、产业生态“聚力”、场景应用“赋能”七大行动,将大模型作为重点推进方向。

5月28日,海创汇旗下创投智能交互服务品牌鲸准与阿里云联合,在创业服务行业率先发布了创投大模型“鲸准小鲸AI”;6月21日,国家互联网信息办公室发布第六批境内深度合成服务算法备案信息,海信视像科技股份有限公司推出的海信星海通用文生图算法在列。

山东省工业和信息化厅于6月13日印发的《关于加快大模型产业高质量发展的指导意见》提出,加快突破一批前瞻性、原创性、引领性大模型关键技术,打造具有一定国际影响力的基础级大模型,在重点领域和关键环节培育一批覆盖范围广、产品能效高的行业级大模型、场景级大模型。

目前,青岛重点研发的大模型产品已经超过了20个,城市形成了以崂山区人工智能产业园为主承载区,西海岸新区光谷软件园、市南元宇宙产业创新园、市北浪潮大数据产业园、城阳数据要素产业园和青岛高新区机器人产业集聚区为特色承载区的大模型产业发展格局。

布局“全市算力一张网”!大模型“算”出青岛未来

价值:“不得不用”大模型

就像是汽车替代马车,电子表格取代手动记账。

同样地,在这样一个AI技术加速迭代的阶段,每一个个体,每一家公司或者机构都面临着该如何用好AI的必答题。

大模型的强大之处在于赋能千行百业,它既可以通过深度互动掌握专业领域知识,又可以作为通用模型广泛应用于日常。

“未来每个人都能拥有定制数字人,数字人背后是人工智能大语言模型,它将以一种更加拟人化、个性化的方式为人们提供娱乐和工作服务。”山东云管家数据科技有限公司副总经理綦俊杰给记者演示钉钉AI能力及场景时,用了10分钟时间给记者建立了一个新的“AI数字员工”。

“AI数字员工是虚拟员工,能以企业员工助手的身份,进入企业通讯录,取得对应的职务权限,参与到企业的组织管理和业务协同中。作为企业员工的有力辅助,数字员工能够协助企业员工完成枯燥重复的程序化工作,让他们将更多精力用于创造性工作。”綦俊杰告诉记者,他每天到公司的第一件事,就是打开电脑,让AI助理协助浏览钉钉群的消息形成智能摘要及待办,发挥销售管理的BI数据、钉钉文档内容生成、视频会议语音转文字的自动概要、“AI文档速读”等功能,大模型让他的工作效率得到全面提升。

“目前,钉钉AI助理中大部分功能是免费的。”綦俊杰对记者表示,在免费功能之外,利用钉钉低代码平台宜搭,应用生成AI助理等适合中小企业使用的功能收费也不高。大模型依托低代码“小、轻、快、准”的特性,将触角伸到了万千真实业务场景里,这显然符合青岛中小企业对大模型应用产品的需求。

2024年是大模型席卷全球的第二年,中国的大模型价格战打响。5月份,字节跳动宣布,豆包主力模型在企业市场的定价只有0.0008元/千Tokens,比行业便宜99.3%。阿里云对标GPT—4的商业化模型Qwen—Long的API输入价格降至0.0005元/千Tokens,直降97%。百度、腾讯、智谱AI、科大讯飞等一众头部企业纷纷跟进。

阿里云公共云事业部区域总经理李成龙表示,对于中小企业来说,大降价带来的接近“免费”的大模型调用成本,让很多中小企业更愿意先把系统“跑起来”试试,创新成本降低、创新热情提升。

“我认为大模型使用越早,可能收益越好。”在青岛市人工智能产业协会秘书长姜代楠看来,大模型产品可以在产品设计、生产线的工艺优化、生产的质检环节等方面降低企业成本,有望让每个人、每个团队、每个企业、每个行业真正地提高劳动生产率。

基础:让数据为底

AI发展,尤其是大模型的发展离不开海量数据的累积与深度学习。孙仁诚认为,大模型的基础就是数据,有了数据才能谈到模型开发和算力。

数据,就是大模型进一步发展的先决条件。

青岛在数据开发利用方面,可谓“数满质高”—数据体量大、质量高,并在数据资源化、数据资产化、数据产业化等方面走在了全国的前列。

6月13日,在青岛市数据要素供需对接会上,青岛市大数据发展管理局局长张艳介绍,当前,青岛公共数据开发利用的资源池已汇聚高点视频、物联感知等高质量公共数据总量3180TB,包括1.3万个可共享数据集;自1998年以来的全市电子文件信息10.3亿件;电子病历、健康档案等高质量健康医疗数据41亿条;机场、地铁、港口、公路等交通运输数据资源2160亿条。

青岛市大数据发展管理局副局长王朝静告诉记者,2022年青岛市就开始了公共数据运营试点工作,开发了一定数量的公共数据运营场景,在交通、教育、医疗、海洋等都有了一些应用场景典型案例。例如,青岛市在全国率先成立数据资产登记评价中心。随着数据要素资源的不断集聚,青岛在本次数据要素供需对接会首次提出“以数招商”的概念,对公共数据资源、社会数据资源进行统一的摸底,与全国的数商企业进行合作,共同打造更优质的大模型应用产品。

王朝静表示,下一步,青岛市大数据发展管理局将统筹全市数据资源,推动公共数据和社会数据按需汇聚有序供给,探索企业数据资产化新路径和交易运作的新机制,鼓励企业开展数据采集、清洗、标注、质检等业务,构建大数据产品供应和交易服务市场。

2024年年初,国家数据局等17部门联合印发的《“数据要素x”三年行动计划(2024—2026年)》进一步明确“建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练”。通过数据要素建设推动人工智能大模型发展,可以有效突破人工智能研发,特别是大模型研发所面临的数据瓶颈,进一步发挥大模型汇集和处理世界知识数据的能力,从而创造更大的生产力,助力中国从数据经济走向智能经济新发展模式。

青岛在数据开放上的魄力和进度,以及在挖掘数据要素价值方面的创新机制,为企业挖掘数据应用场景、开展深层次合作提供了广阔的市场空间。

优势:产业与算力

数据是基础,但如何实现应用才是重头戏。

“对于大模型,我们不能只把自己看作使用者。特别从青岛市的层面讲,还是要思考如何深入其中,创造一些展现青岛优势的大模型产品。”孙仁诚表示,目前市场上较为知名的大模型产品,基本是以ChatGPT、通义千问、文心一言为代表的基础大模型或者通用大模型。“这些产品最大的特点就是背后拥有海量的数据,能服务于各行各业,如果仅从‘通用’角度出发,青岛显然是不具备竞争力的。”

那么青岛发展大模型的优势在何处?在孙仁诚看来,一是产业,二是算力。

“大模型要真正产生价值,最后一定要和企业、行业背后的数据紧密结合,就像使用搜索引擎一样,搜索出的结果本身价值有限,但将它们应用到具体的场景后,这些结果才能说有了价值。”孙仁诚说道。

青岛的产业优势不言而喻,海尔、海信、青岛啤酒这些行业巨头的存在,让青岛在制造业赛道上脱颖而出。也得益于这种制造优势,青岛的大模型机遇就体现在“产业大模型”身上。

“产业大模型其实就是在基础大模型、通用大模型的基础上,利用它们的数据,更加精准、垂直地应用在特定领域,为领域内相关的企业提供服务。”鲸准数据院负责人张文政告诉记者。

以海尔集团旗下海创汇平台推出的“鲸准小鲸AI”为例,该产品专注于投融资领域,致力于为用户提供高效、准确、个性化的投融资咨询服务。在这个创投大模型背后,是海创汇积累的超106万家创业企业、5万余位认证投资人、200多家高校科研机构以及超过10万家服务机构,这些资源形成了鲸准独有的创业大数据、项目大数据、投资人大数据和行业大数据的数据库,能够精准地服务创业者、投资人、行业分析师以及投资机构等创投领域的相关用户。

“我们之所以可以打造产业大模型,归根结底是因为拥有海尔这样的行业领军企业,足够了解市场,也拥有足够的体量。”张文政将海尔、海信、青啤这些企业比作圆心,在它们的“圈子”里有数以万计的攸关方,而“圆心”们打造的大模型产品几乎具备一呼百应的能力,谁与之相关,谁就能获得精准的大模型赋能。

聚焦算力,青岛同样有深厚的积淀。

天眼查最新数据显示,中国现存378.42万家算力基础设施相关企业,北京、广东、山东分别列区域前三名。其中,青岛与算力基础设施相关的企业达4.9万家。

特别是近两年,青岛算力设施建设进展迅速,移动、联通、电信等运营商,以及包括阿里云、腾讯云、华为云、京东云、微软云、亚马逊、鹏博士等相关算力企业均在青岛加快布局。中国联通(青岛)智算中心和中国移动智算中心(青岛)在内的5家算力中心已相继启用。目前,青岛已建成由神威国产超算、X86超算、GPU和大数据存储四大集群构成的超大规模混合算力平台,算力规模处于国内头部方阵,形成了国内支持人工智能大模型训练规模最大、性能最优、支撑重大专项最多的国产超算集群,算力总规模超过了2300P。在工信部备案的大中型数据中心8个,标准机架突破了5万架。

目前,青岛已开通了国家级互联网骨干直联点,正在加快建设青岛市算力统筹调度平台,布局“全市算力一张网”,提升算力云服务能力,促进边缘算力协同部署,提高算力利用效率,正积极融入和服务山东算网、全国一体化算力网。

“算力是发展大模型的硬性条件。一部分人曾将青岛形容为‘互联网荒漠’,可深入了解就会发现,青岛这些年一直在为互联网时代的后半场做准备。特别是在算力的储备上,青岛拥有优势。”张文政说道。

思考:大模型并不万能

大模型的发展充满了想象力,也让众多创业公司纷纷涉足其中,希望通过技术创新实现弯道超车。

“对待大模型必须冷静。”青岛市人工智能产业协会秘书长姜代楠严肃地说道。

大模型的训练是一个资金成本和时间成本投入皆高的过程,随着时间和技术的发展,大模型需要持续的维护、更新和优化,这涉及大量的计算资源和人力资源投入。

“大家都在抢占大模型的赛道,包括一些资本也在入局。但大模型研发门槛是比较高的,将大模型打磨成熟需要的时间也比较长。”姜代楠表示,青岛市算力“一张网”已经建成,产业优势也十分明显。在大模型应用方面,结合青岛实际,产业也应在海洋大模型体系和细分行业领域的垂直大模型体系更多发力。

在人才方面,城市则需要加大人工智能紧缺急需人才的招引力度,促进高端人才向人工智能产业聚集,如引导高校和头部企业共建人工智能实训基地;大力培养卓越工程师、高技能人才等实践型人才。

“协会愿作为和谐重构的连接器,把AI产业和传统产业进行结合,赋能青岛传统产业突飞猛进的发展。”姜代楠还透露,青岛市正在酝酿对人工智能大模型和算力出台新的奖励政策包,近期就将公布。

“大模型能做许多事情,但它不是万能的。”在孙仁诚看来,大模型可以赋能于多种产业,但本质上依旧是一种“生成式”算法,不以“精准”著称,更多是提供一种指导思路。“大模型虽然是人工智能的一部分,但它却是理性中的‘感性派’。我们不能寄希望大模型对未来趋势做出精准研判,提出意见、辅助决策,才是它的价值。”

张文政也有相似的观点,“不上头”是他的核心观点。“大模型不是说做就做的,宏观上看,如今的大模型基本还是以大企业为主导。这不是一个无脑跟风的业态,它的投入成本很高,中小企业与其做开发者,倒不如去享受大模型提供的服务,不能因为是蓝海或者有热度,就头脑发热。”

在众多从业者的眼中,大模型的发展趋势与电商平台类似。初期百家争鸣,但随后便会进入洗牌期,数据为底,流量为王,赢家通吃。

这会是一个充满想象力又角色分明的新业态。谁搭建底层逻辑,谁开辟垂直赛道,谁是开发者,谁是使用者,各有各的职能,各自扮演各自的角色。

大模型,像一个拥有魔法般力量的智慧伙伴,助力青岛向着“人工智能+”巅峰迈进。

原标题:大模型“算”出青岛未来