最新！上海交通大学研发的“兆言”大模型在重庆发布_教育

教育 > 教育

推荐文章

排行榜

最新！上海交通大学研发的“兆言”大模型在重庆发布

日期:2023年07月13日 16:40:16 作者:储舒婷

微信图片_20230713163636.jpg

7月13日，上海交通大学重庆人工智能研究院“兆言”（下称：“兆言”）大模型在西部（重庆）科学城发布。

发布会上，上海交通大学重庆人工智能研究院院长、首席科学家金石介绍，和通用大模型相比，“兆言”大模型拥有“领域精调效率高、训练推理成本低、人机交互能力强”的特点。基于全球领先的AI大模型技术研发的“兆言”，通过积累海量数据，辅以独特的数据处理和AI训练技术，以达到精准、专业的文本输出，并且能够实现以自然语言选择、调用应用程序的能力，助力打造个性化的智能产品。

通用大模型在行业落地面临许多困难。比如，未经行业精调的通用模型在行业应用中表现不佳、通用大模型需要的算力资源不易进行私有化部署、自然语言转API调用不稳定等。“兆言”大模型较好地解决这些问题。

此外，该模型采用启发式数据过滤及增强、模型预训练和精调自适应比例混合、人工和自动评测相结合等方法对模型进行垂直领域精调，解决了精调中的数据质量差、模型原有能力遗忘、模型答案出现幻觉、模型训练效率低等行业难题，使得模型答案质量有很好的保障。

模型研发还把小型化部署作为重点，大幅降低模型训练和推理成本。在商业化所需特定任务上，模型回答质量不降低，而调用成本仅为小型化前的四百分之一，从而保障了以模型为基础的产品在市场上的竞争力。为解决在自然语言转应用程序接口（API）调用任务上模型发挥不稳定的问题，研发团队还建立了专有的自然语言调用语料和指令数据集，从而实现了大语言模型对其他系统的精准调用。

发布会上，上海交通大学重庆人工智能研究院还与华院计算技术（上海）股份有限公司、重庆赛迪工程咨询有限公司、重庆誉存科技有限公司、中国移动通信集团重庆有限公司、北京流金岁月传媒科技股份有限公司、重庆赛宝工业技术研究院有限公司进行了现场签约，将发挥各自优势，促进大模型技术在制造业、金融、农业、文旅、教育、医疗、司法等场景落地应用。

　　作者：储舒婷

　　编辑：吴金娇

责任编辑：姜澎

图片来源：上海交通大学供图

*文汇独家稿件，转载请注明出处。

分享到：

微信扫一扫：分享
微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈。

微信扫一扫：分享