“我们正处于临界点。”在商汤科技董事长兼首席执行官徐立说出这句话后一个月,商汤科技今天在沪发布通用人工智能(AGI)大模型体系“日日新”。该体系内包含了中文语言大模型“商量”、文生图生成模型“秒画”、AI数字人视频生成平台“如影”、3D背景建筑生成平台“琼宇”和3D物体生成平台“格物”。
“日日新”取名自《礼记·大学》中的“苟日新,日日新,又日新”,体现大模型日新月异,不断进化之意。这一大模型体系可提供自然语言生成、内容生成、自动化数据标注、自定义模型训练等多种大模型能力,同时结合决策智能大模型,为实现AGI提供助力。
徐立表示,生成式AI正在跨越生产力“红线”,新的软件开发范式已经产生。在新的二八定律下,未来80%的代码将由AI生成,实现AI for AI。
大模型将串联起各类垂直任务,迭代行业场景
“日日新”大模型自2019年开始研发,目前整体参数量达到5000亿,今年目标达到万亿。在今天的技术交流中,商汤科技用现场演示的方式,逐一展示了这套可自己生成文字、图片、视频的大模型“全家桶”。
“商量”是一个基于千亿参数的中文大语言模型,支持多轮对话、逻辑推理、语言纠错、内容创作、情感分析等应用。相比ChatGPT,它充分考虑了中文语境,能够更好地理解和处理中文文本。现场演示中,“商量”展现了出色的多轮对话和超长文本理解能力。比如向其进行健康咨询时,它会询问你出现这种症状多久了、有没有其他症状,在掌握了足够信息后,才给到相应的医疗建议。而向其咨询法律问题时,它不仅会回答你的问题,还会摘选出答案的出处。目前“问诊助手”功能已在包括新华医院在内的多家医院落地,未来有望面向更多医院开放。
“商量”还集成了“AI代码助手”功能,在公司内部的测试中,代码助手将编程效率提升62%,一次通过率达到40.2%。
10亿参数训练的自研文生图生成模型“秒画”,可实现两秒生成一张512K分辨率的图片。更为“惊艳”的是,它支持单卡自训练。只要上传20张同一风格的图片,等待一段时间,即可训练出某种风格的模型,这让个人创建自己的风格模型变成可能。
以往,建模是一件相当专业的事,而且需要耗费很长时间。有了3D物体生成平台“格物”,只需手机绕着物体扫描三圈,即可生成一个栩栩如生的3D模型,纹理、光线无不一一还原。据介绍,该技术有望为直播带货、游戏设计、元宇宙等领域带来变革。
徐立表示,在这个时间点推出大模型体系,是希望吸引更多下游用户,自然语言模型能够把各种垂直类的任务串联起来,用多模态混合的模式迭代行业场景。
大模型时代,数据、算法和算力正在经历新的演变
“在AI大模型时代,数据、算法和算力这三要素在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,必然会导致算力需求的剧增。”徐立表示,过去10年最好的AI算法对于算力的需求增长超过了100万倍,也就是每两年最先进的算力要提高一个数量级才能支持最好的AI大模型。商汤用AI大装置打造“日日新”大模型体系,希望在模型的迭代速度及处理问题的能力上日日更新,不断解锁AGI的更多可能。
就在上个月,商汤发布了开源社区多模态多任务通用大模型“书生”,其拥有30亿参数,可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。
之所以能不断推出AI大模型,得益于商汤前瞻布局的大算力基础设置。业界训练大模型对大算力的需求非常旺盛,而且真正好用的基础设施十分稀缺。商汤历时五年,建设了业界领先的AI大装置。目前,该大装置总共有27000块GPU芯片卡,可输出5.0exaFLOPS的总算力,在全国排名第一,也是目前亚洲最大的智能计算平台之一。目前,商汤AI大装置上的算力可同步支持20个千亿规模参数量的超大模型以千卡规模同时进行训练。
商汤对通用人工智能的未来寄予厚望。公司联合创始人、首席科学家王晓刚表示,AGI催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。AGI将实现从“数据飞轮”到“智慧飞轮”的演进,最终迈向人机共智。
本报记者测试“商量”。
不过要实现这一美好愿望,“日日新”大模型还需像其名字一样,在数据量、参数结构及能处理的问题上,日复一日地精进提高。记者发现,在实际使用中,大模型一本正经的胡说八道,在“商量”语言模型中依然存在。比如问它是否知道“林黛玉倒拔垂杨柳”时,它的回答是:“这是出自中国古代小说《红楼梦》里的一个著名情节。”询问它如何看待百度的文心一言、阿里的通义千问和华为的盘古大模型时,它表示:“文心一言是明代文学家冯梦龙所著《醒世恒言》中的名篇,通义千问是清代文学家李汝珍所著《镜花缘》中的名篇,盘古则是中国的创世神话。”让它为上海市民给出“五一”长假出行建议时,它列出的均为上海的旅游景点。
作者:沈湫莎
图片:除注明外为商汤科技提供
责任编辑:任荃
*文汇独家稿件,转载请注明出处。