“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务。”在今天举行的2023世界人工智能大会上,阿里云CTO周靖人透露,阿里云魔搭社区现已聚集180万AI开发者和由20多家顶尖人工智能机构贡献的900多个优质AI模型,将努力把魔搭社区培育成中国最大的‘大模型自由市场'。”
资料显示,阿里云是业内最早布局大模型的科技公司之一,其自研的通义系列大模型已发展成涵盖多个模型和产品的家族。去年,阿里云在国内首倡MaaS(Model as a Service,模型即服务)理念,提出以AI模型为核心的开发范式,并搭建了一套以AI模型为核心的云计算技术和服务架构,这套能力将全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务。
在基础设施层,阿里云拥有国内最强的智能算力储备,阿里云的智算集群可支持最大十万卡GPU规模,承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。
在AI平台层,以机器学习平台PAI为核心的PaaS服务可支持万卡的单任务分布式训练规模,覆盖全链路AI开发工具与大数据服务,AI训练效率提升可达10倍,推理效率提升可达6倍。
阿里云的灵积模型服务平台,将面向所有业界模型开放。平台建设了一系列自动化的模型上云统一工具链路,支持模型的自主接入,所有接入灵积平台的模型都能自动获取平台的强大服务能力,包括基于阿里云强大算力的跨区域自适应弹性能力,并提供基于云原生的公共部署以及用户自定义独占部署等多种形式,来满足不同模型的需求。灵积平台还积累了模型自适应推理优化和高效微调训练的能力,并提供了基于插件进行模型能力拓展的系统框架。通过灵积,丰富多样化的模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。对于AI开发者而言,这些不同模型的能力都能通过统一的SDK方便地获取并集成到自己的AI应用中去。当前灵积平台上托管了包括通义千问、ChatGLM-v2、百川、姜子牙、Dolly等在内的业界领先大语言模型。
在开发者生态层,阿里发起的AI模型社区魔搭集聚了180多万AI开发者和900多个优质AI模型。模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模大模型。
在魔搭这个自由市场,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。魔搭社区打通了与灵积平台的部署链路,支持社区的模型通过灵积来实现服务化。为进一步降低大模型使用门槛,阿里云在大会现场推出了一款智能工具魔搭GPT(ModelScopeGPT),它能接收用户指令,通过“中枢模型”一键调用魔搭社区其他的AI模型,大小模型协同完成复杂任务。这是国内首款大模型调用工具。
魔搭GPT现已能够调用魔搭社区十多个核心AI模型的API,未来随着更多模型API的加入,魔搭GPT的能力也将不断增强。构建这一模型调用工具的数据集和训练方案将会对外开放,供开发者自行使用,开发者可以根据需要对不同的大模型和小模型进行组合。
作者:徐晶卉
编辑:商慧
责任编辑:戎兵
*文汇独家稿件,转载请注明出处。