近日,国内首批通过《生成式人工智能服务管理暂行办法》备案的大模型产品陆续上线,正式向全社会公众开放服务,大模型技术指的是使用大规模的神经网络模型,基于语言的交互来完成各类人工智能任务的技术,当前,大模型技术在全球快速迭代,目前已经有了ChatGPT等应用。那么,国内大模型市场发展的现状如何?
“百模大战”跑马圈地
国内人工智能大模型集中上线
在北京一家做大模型自主研发的创业企业,推出的大模型应用已经对社会开放服务近10天,工作人员还在对大模型生成内容进行优化和完善,目前大量的问答集中在文本创作、教育等领域。
某人工智能大模型企业首席执行官 张鹏:它本身是一个大语言模型,所以在语言方面的能力更强,我们估算相当于一个本科毕业生的水平,数理类的能力接近中学水平。我们将在几个月时间对模型进行一次升级。
据统计,国内有11家大模型陆续通过《生成式人工智能服务管理暂行办法》备案,其中北京5家,上海3家率先上线,广东2家和安徽1家也陆续开放。
记者了解到,国内最新上线的通用大模型更像是一个基础设施,在它之上可以孵化更多专业领域的垂直模型,为各行各业的数字化转型服务。
业内人士表示,当前通用大模型的投入成本很高,还需要和具体的应用场景进行有效结合,相关产业还处在发展的初期阶段。
中央财经大学中国银行业研究中心研究员 聂俊峰:处在市场跑马圈地、行业规则还没有建立、市场格局还没完全形成的阶段。人们把它称为“百模大战”,从去年到现在,国内已经发生了接近100起以上的大模型行业的融资案例。从整个产业的投入估值来说,2023年这个行业新增投入大概在150亿元到200亿元。
大模型人才稀缺薪资走高
算力算法市场活跃
△央视财经《天下财经》栏目视频
大模型市场的升温也在带动上下游产业链,包括数据、算力和算法,相关领域的人才,例如大模型工程师,在国内也供不应求,收入水平也持续走高。
刘欣旸是一名大模型工程师,他每天主要的工作就是训练各个行业的大模型,在此之前,他从事的是搜索引擎的开发。在2022年,他转型研发大模型技术。
某人工智能企业大模型工程师 刘欣旸:我训练的大模型包括金融行业、房产行业以及医疗行业、水利。毕竟大模型是一个新产生的技术,它到可用还需要进行一定的训练。
根据相关机构的统计,国内人工智能工程师和算法科学家的平均年薪已经超过60万元,而且企业对大模型技术研发人才需求旺盛,部分核心领域存在较大的缺口。
某信息技术集团首席技术官 刘会福:真正懂行业的专家是非常需要的,懂人工智能、懂算法、懂模型的也是非常需要的,因为每一轮人工智能发展的结果都是让那些善于用工具的人更好地生存。
大模型市场的升温也在带动算力算法产业,包括“大模型”的芯片、计算集群、服务器、通信网络硬件以及云计算、数据库、虚拟化功能等软件。算力基础设施和算力服务对大模型训练不可或缺,其性能、质量和稳定性决定了模型训练效果。
在国际市场上,目前一张专门用于训练人工智能大模型的芯片价格甚至被炒到了4.5万美元,折合人民币超过了30万元。国内相关领域芯片的自主研发也在提速。
清华大学人工智能国际治理研究院副院长 梁正:算力是大模型落地一个比较高的门槛,这个层面国家已经在统筹部署,也就是我们国家层面算力网的建设,各个地方有一些计算中心,以前可能更多是CPU,现在就是加上智算GPU。
扫码下载坪山发布APP(安卓版)
扫码下载坪山发布APP(苹果版)