大模型提升机器理解能力,优化人机交互方式。AI大模型是实现通用人工智能(AGI)的重要方向,包含自然语言处理(NLP)、计算机视觉(CV),多模态大模型等。ChatGPT推出两个月MAU突破1亿,是自然语言处理领域突破性的创新,大力出奇迹后出现涌现能力,更理解人类语言。大模型“预训练+精调”即可对下游应用赋能。我们认为大模型优化人类与机器交互方式,是效率的革命。大模型是“大数据+大算力+强算法”结合的产物,对比国内外大模型,算力储备上国内并无短板;算法上OpenAI有先发优势;前期数据的丰富度和量对大模型的训练至关重要。百度文心大模型:包含NLP、CV等在内的系列大模型。文心大模型包含NLP大模型、CV大模型、跨模态大模型、生物计算大模型、行业大模型等。与Bing类似,文心一言有望优化C端用户搜索、创作体验;ToB方面,百度已开放大模型API接口,在文案、AI作画、开放域对话方面赋能企业。对于具体行业,百度推出文心行业大模型,以“行业知识增强”为核心特色。阿里巴巴通义大模型:由通义-M6模型融合语言模型和视觉模型组成,率先应用在硬件终端天猫精灵和软件通义千问。通义大模型包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。在应用上,天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟”;对话式通义千问已经开始内测。腾讯混元大模型:采用热启动降低训练成本,文字视频等多领域表现优异,已在广告游戏等多场景落地。目前腾讯混元大模型已在腾讯广告、内容创作、游戏、对话式智能助手等方面实现落地,大幅提升工作效率并降低成本。华为盘古大模型:基于ModelArts研发设计的系列模型,在物流、药物研发、气象预测等多领域已实现落地。目前盘古CV大模型已覆盖了物流仓库监控等领域;NLP大模型覆盖了智能文档检索、智能ERP和小语种大模型;科学计算大模型则应用于气象预报、海浪预测等方面。字节跳动AI探索基础扎实,在语言大模型和图像大模型初步布局。字节跳动AIGC大模型将从语言和图像两种模态发力,预期在今年年中推出大模型。字节跳动在算力、算法、数据方面并无短板。目前模型可用于图文、视频内容生成等,飞书将推出智能AI助手“MyAI”。投资建议:当前,各家公司开展新一轮AI模型竞赛,希望借助大模型开展“模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素,重点关注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。风险提示:AI技术迭代进度不及预期;AI应用落地进度不及预期;政策风险;供应链风险等。重点公司盈利预测及投资评级公司代码0700.HK9988.HK9888.HK
公司名称腾讯控股阿里巴巴-SW百度集团-SW
投资评级买入买入增持
昨收盘总市值(港元)(百万,港元)365.43,497,06494.82,007,891129.6362.437
EPS
2023E15.76.77.9
2024E18.07.69.3
PE2023E
201214
2024E
181112
超配行业研究·海外市场专题互联网·互联网Ⅱ超配·首次评级证券分析师:谢琦*****************************.cnS0980520080008联系人:王颖婕***********************************.cn
联系人:陈淑媛**********************************.cn
市场走势资料来源:Wind、国信证券经济研究所整理
相关研究报告《2023年3月电商数据:-消费复苏强劲,线上渗透率继续提升》——2023-04-18
《互联网行业动态点评》——2023-03-16
《互联网行业动态点评-2022年12月电商数据:国内消费逐步回暖,零售线上化率进一步提升》——2023-01-31《互联网行业动态点评-2022年11月电商数据:消费受疫情短期冲击明显,线上消费反弹快韧性强》——2022-12-21
《互联网行业动态点评-电商双11:行业增长趋缓,综合电商提升体验,直播电商继续抢占份额》——2022-11-24
资料来源:Wind、国信证券经济研究所预测
请务必阅读正文之后的免责声明及其项下所有内容证券研究报告内容目录
大模型概述:大模型提升机器理解能力,优化人机交互..............................5
AI大模型是实现通用人工智能(AGI)的重要方向..........................................5大模型应用:“预训练+精调”即可对下游应用赋能,优化人类与机器交互方式.................6大模型三要素:算力、算法、数据........................................................9百度文心大模型...............................................................12
模型简述:已拥有NLP、CV、跨模态、行业等多个AI大模型场景............................12模型toC应用:文心一言有望优化C端用户搜索、创作体验.................................13模型toB应用:开放API接口赋能企业,精调行业模型.....................................14阿里巴巴通义大模型...........................................................16
模型简述:由通义-M6模型融合语言模型和视觉模型组成...................................16模型应用:率先应用在硬件终端天猫精灵和软件通义千问...................................17腾讯混元大模型...............................................................18
模型简述:热启动降低训练成本,文字视频等多领域表现优异...............................18模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本.............................20华为盘古大模型...............................................................22
模型简述:基于ModelArts研发设计的系列模型,NLP、CV等方向性能优越...................22模型应用:在物流、药物研发、气象等多个场景实现落地,极大提高行业效率.................23字节跳动大模型...............................................................24
模型简述:AI探索基础扎实,语言大模型和图像大模型初步布局............................24模型应用:可用于图文、视频内容生成等,飞书将推出智能AI助手“MyAI”.................25投资建议.....................................................................27风险提示.....................................................................27免责声明.....................................................................28
请务必阅读正文之后的免责声明及其项下所有内容2证券研究报告图表目录
图1:消费级应用达到一亿用户花费时长(月)..................................................5图2:ChatGPT对话演示.....................................................................5图3:ChatGPT能力实现解析.................................................................6图4:训练大模型“预训练+精调”模式.......................................................6图5:OpenAI宣布推出插件功能..............................................................7图6:SegmentAnythingModel(SAM)演示...................................................8图7:大语言模型产品应用价值链与已渗透部分应用............................................8图8:生成式AI发展历程与ChatGPT的突出能力...............................................9图9:主要数据集大小汇总(部分,GB).....................................................10图10:百度文心全景图....................................................................12图11:百度NLP大模型....................................................................13图12:中国大模型市场2022年评估结果——百度.............................................13图13:文心一言对话演示..................................................................14图14:百度文心大模型API.................................................................14图15:百度文心行业大模型原理............................................................15图16:文心行业大模型案例................................................................16图17:阿里巴巴通义大模型系列架构........................................................16图18:阿里巴巴通义-M6发展历史...........................................................17图19:阿里巴巴深度语言模型AliceMind.....................................................17图20:阿里巴巴通义-视觉大模型...........................................................17图21:鸟鸟分鸟基于通义大模型系列........................................................18图22:鸟鸟分鸟15天训练流程.............................................................18图23:阿里巴巴通义千问..................................................................18图24:阿里巴巴通义千问百宝袋............................................................18图25:HunYuan-tvr在5个公开数据集上排名第一.............................................19图26:HunYuan-NLP1T模型在CLUE总榜、分类榜和阅读理解榜登顶.............................19图27:HunYuan大模型及解决方案...........................................................19图28:腾讯广告多媒体AI技术研究与应用情况...............................................20图29:腾讯智能创作助手功能一览..........................................................20图30:腾讯游戏AI路网生成模型...........................................................21图31:腾讯混元助手项目组织架构..........................................................21请务必阅读正文之后的免责声明及其项下所有内容3证券研究报告表1:大模型比较.........................................................................11表2:国内大模型概述.....................................................................11表3:盘古系列模型应用场景和领域.........................................................23表4:相关公司盈利预测及估值.............................................................27请务必阅读正文之后的免责声明及其项下所有内容4证券研究报告大模型概述:大模型提升机器理解能力,优化人机交互AI大模型是实现通用人工智能(AGI)的重要方向
AI大模型是实现通用人工智能(AGI)的重要方向。AI大模型是基于海量多源数据打造的模型。AI大模型具备通用、可规模化复制等诸多优势,是实现AGI(通用人工智能)的重要方向。AI大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。ChatGPT推出两个月MAU突破1亿,是自然语言处理领域突破性的创新,进一步理解了人类语言。大语言模型(LargeLanguageModel,LLM)是一种使用了大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT在2022年11月底推出后,2023年1月的月活跃用户数已达1亿,成为历史上用户增长最快的应用。ChatGPT的自然语言处理能力超越了以往的自然语言处理模型,可以应对各种自然语言处理任务,包括机器翻译、问答、文本生成等。图1:消费级应用达到一亿用户花费时长(月)图2:ChatGPT对话演示资料来源:YahooFinance,国信证券经济研究所整理资料来源:ChatGPT,国信证券经济研究所整理
ChatGPT由OpenAI研发,GPT模型已更新至GPT-4,大力出奇迹后出现涌现能力。GPT全称是GenerativePre-trainedTransformer,是OpenAI开发的一系列延伸自转换器架构(Transformer)的自然语言生成模型。2018年,OpenAI推出GPT-1。2022年11月,OpenAI推出了对话交互式的ChatGPT。ChatGPT在GPT-3.5之上用基于人类反馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入,使机器更理解人类语言,让GPT获得更逼真的结果。ChatGPT在逻辑推理、上下文理解等方面的能力,是模型规模达到量级后“涌现”出的。证券研究报告图3:ChatGPT能力实现解析资料来源:《NaturalLanguageProcessingwithDeepLearning,JesseMu》,艾瑞咨询,国信证券经济研究所整理
大模型应用:“预训练+精调”即可对下游应用赋能,优化人类与机器交互方式
大模型借助“预训练+精调”等模式,用相比较大模型更少量的数据即可对下游应用赋能。预训练大模型基于海量数据的完成了“通识”教育。在具体应用场景下,借助“预训练+精调”等模式,应用模型用相比较大模型更少量的数据即可进行相应微调,高水平完成细分应用的任务。图4:训练大模型“预训练+精调”模式资料来源:IDC,百度,国信证券经济研究所整理
大模型增强机器理解力,优化人类与机器交互方式,提升信息处理效率。1)自然语言类大模型:人类可以用自然语言方式,与机器形成交互。ChatGPT为自然语言方面的大模型应用,语言文本处理是人类世界最重要的工作内容之一,如果AI能证券研究报告够懂的人类自然语言,并与人类形成交互,将协助人类大幅提升语言文本处理效率,带来生产力效率提升。例如,ChatGPT可以依托人类自然问答的方式,帮助人类完成回答问题、虚拟助手(计划旅行、预定餐厅、购买产品等)、创作、文本、编程、摘要等工作。我们也可以通过语言类大模型调用机器工具,大模型相当于人类助手。根据微软论文《SparksofArtificialGeneralIntelligence:EarlyexperimentswithGPT-4》,GPT-4能够根据人类指令推断出需要哪些工具,有效地解析这些工具的输出并适当地做出回应,而无需任何专门的训练或微调。2023年3月23日,OpenAI宣布推出插件功能,帮助ChatGPT访问最新信息、进行计算或使用第三方服务。据OpenAI官网,第一批支持ChatGPT第三方插件的网站共11个,包含电商、预定航班、订购食材、检索实时信息、检索知识库信息等领域。图5:OpenAI宣布推出插件功能资料来源:OpenAI官网,国信证券经济研究所整理
2)视觉类大模型:与语言模型类似,视觉类模型需要完成对图片的理解。2023年4月6日,MetaAI在官网发布了基础模型SegmentAnythingModel(SAM)并开源,其本质是基于Transform模型架构,可以对图像中的一切对象进行分割。交互方面,SAM可使用点击、框选、文字等各种输入提示,指定要在图像中分割的内容。精准分割为大模型图像理解的基础。图像理解可以在智能驾驶、图像识别、安防(人脸识别)等方面进行利用。证券研究报告图6:SegmentAnythingModel(SAM)演示资料来源:Meta,国信证券经济研究所整理
3)多模态融合:多模态为语言、图片、音频等多个模态的感知和认知融合。多模态大模型能够让机器结合环境因素来模拟人与人之间的交互方式,让图像、文本、语音等模态之间的统一表示和相互生成。多模态融合也是各大模型着重努力的方向。当前,已有的大模型可在文本、图像等方面赋能,已有的渗透应用包括搜索引擎(Bing等)、办公工具(Microsoft365)、企业服务应用、垂直领域应用(金融、电商等)等等。根据2023阿里云峰会,阿里巴巴集团董事会主席兼CEO张勇表示“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍”。图7:大语言模型产品应用价值链与已渗透部分应用资料来源:艾瑞咨询,国信证券经济研究所整理
证券研究报告大模型三要素:算力、算法、数据
大模型是“大数据+大算力+强算法”结合的产物。1)算力是AI发展的基础设施,芯片至关重要。算力的大小代表着对数据处理能力的强弱。芯片性能越好,大模型的处理能力越快。比如,黄仁勋在2023年2月财报会中表示“过去十年,通过提出新处理器、新系统、新互连、新框架和算法,并与数据科学家、AI研究人员合作开发新模型,已使大语言模型的处理速度提高了100万倍。”2)算法是AI解决问题的机制,源于算法理论发展、迭代优化。不同算法可以看做解决问题的不同路径,算法的优劣可以用空间复杂度与时间复杂度来衡量。例如,GPT是在Transformer模型基础上发展的,Transformer由GOOGLE在2017年提出。Transformer相比于传统的循环神经网络(RNN)或卷积神经网络(CNN),在处理长文本时具有更好的并行性和更短的训练时间。图8:生成式AI发展历程与ChatGPT的突出能力资料来源:艾瑞咨询,国信证券经济研究所整理
3)数据是算法训练的养料,前期需要给模型喂养大量数据,形成模型理解能力,中后期数据质量决定了模型精度。机器学习中要用标注好的数据进行训练,数据标注对未经处理的初级数据进行加工处理,转换为机器可识别信息,只有经过大量的训练,覆盖尽可能多的各种场景才能得到一个良好的模型。当前,数据的丰富度和量对大模型的训练至关重要,只有大量数据的训练,大模型才有理解能力涌现的可能。当前训练数据集来源多为公开数据,比如根据AlanD.Thompson文章,列举的大模型的数据集包括维基百科、书籍、期刊、Reddit链接、CommonCrawl和其他数据集等。中后期,高质量数据将提升模型的精度。比如更加事实性的数据将提升模型准确性,更加通顺的中文语言将提升模型理解中文语言能力。另外,高质量反馈数据也可提高模型性能,比如ChatGPT采用人类强化学习RLHF,通过更专业的问题、指令、人类反馈排序等加强模型理解人类语言逻辑。最后,也可以通过更精准的垂类数据,完成部分更细分领域模型搭建。证券研究报告图9:主要数据集大小汇总(部分,GB)资料来源:AlanD.Thompson《What’sinmyAIpaper》,国信证券经济研究所整理;注:确定的数据以斜体表示。仅原始训练数据集大小。
我们从以上三个维度,分析当前发布的部分大模型:1)算力:算力布局主要来源于芯片的采购布局,算力基础设施的投入阻挡了部分小公司的入局。当前数据训练需要较高性能的芯片完成对整体模型神经网络的训练构建,供应厂商包括英伟达等。应用层面只需调用整体大模型里的部分神经网络,故对芯片要求没有训练模型时那么高。2)算法:OpenAI仍有先发优势,GPT-3之后并未开源。每家公司都有自己实现大模型的路径算法,由于GPT在成立之初就坚持自己的算法路径(采用单项Transformer架构等),并在此基础上运用大量数据训练使得模型产生的涌现能力,取得了一定的成功,拥有先发优势。自GPT-3开始(2020年),OpenAI便不再公布大模型相关训练及技术细节。虽然当前OpenAI的成功提供部分借鉴,但其他公司仍需时间去研发追赶并进行模型迭代。除此以外,部分公司在特定领域拥有算法积累的先发优势,比如搜索类公司对语料的切割和识别有先发优势,视觉类公司在图像领域识别有先发优势。3)数据:当前中文语料规模与质量上不如英文语料。根据W3Techs,中文网站占全球网站数1.3%,英文网站占比63.6%。除此以外,由于中国移动互联网发展较为成熟,大量的中文数据资源被存于各家企业或机构里,较难共享。证券研究报告表1:大模型比较企业OpenAIGoogleMeta微软百度阿里腾讯华为模型GPT3LaMDALLaMA参数1750亿1370亿最大650亿RSC超算平台Azure云平台算力上万块GPU(V100)数据45TB预训练1.56TB1.4Ttoken3390亿文本RLHF√×××进度22.11.30日发布ChatGPT23.3.22日发布Bard23.2.24日发布暂未公布产品23.3.16日发布文心一言,23.3.27日发布文心千帆大模型平台23.4.11日发布通义千问暂未公布产品21.4发布盘古大模型Megatron-turing5300亿文心大模型(ERNIW3.0)2600亿M6混元盘古超过10亿2000亿200B飞桨深度学习平台,百4TB(文本与知识图谱)×度云1.9TB图像×292GB文本太极机器学习平台,腾五大跨模态检索数据×讯云集阿里云鹏程云脑、ModelArts40TB×资料来源:OpenAI,Google,Meta,微软,文心大模型官网,通义千问官网,阿里巴巴官网,腾讯太极机器学习平台,华为云,国信证券经
济研究所整理
目前,国内已有百度、阿里巴巴、腾讯、华为等公司对AI大模型进行开发,各模型系列主要的NLP语言大模型、CV大模型、多模态大模型也已推出并实现部分应用落地。此外,据36氪消息,字节跳动也在语言和图像大模型上有所布局,预期将于今年年中推出字节自研大模型。具体来看:百度在AI方面布局多年,具有一定大模型先发优势。当前,申请文心一言API调用服务测试的企业已突破6.5万。在行业大模型上,已经与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。阿里通义大模型在逻辑运算、编码能力、语音处理方面见长,集团拥有丰富的生态和产品线,在出行场景、办公场景、购物场景和生活场景均有广泛应用。腾讯混元大模型已经在广告投放、游戏制作投入使用,目前集团在研究对话式智能助手,预计投入使用后将对QQ和微信生态有一定优化。华为与B端合作紧密,预计未来应用以ToB为主。此外,华为在算法、算力上储备较为丰厚。比如“鹏城云脑II”获全球IO500排行五连冠,拥有强大的AI算力和数据吞吐能力。华为云ModelArts平台的高效处理海量数据能力,7天完成了40TB文本数据处理。盘古大模型最早已经在2021年4月正式发布,当前盘古大模型训练文本数据高达40TB(GPT-3为45TB)。表2:国内大模型概述公司百度大模型文心大模型底层支持模型系列应用文心一言、开放NLP大模型ERNIE3.0/跨模态大模飞桨深度学习平台,文心NLP大模型(ERNIE3.0)、文心CV大模型ERNIE-ViLG/对话大模型PLATO的TOBAPI接口,百度云型、文心跨模态大模型、文心生物计算大模型赋能下游企业文案、AI作画、开放域对话等方面阿里云通义-M6、通义-AliceMind、通义-视觉大模型天猫精灵、通义千问阿里巴巴通义大模型腾讯华为混元大模型盘古大模型腾讯太极机器学习平混元NLP大模型、混元CV大模型、混元多模腾讯广告、文涌(Effidit)、3D虚拟场景自动生台,腾讯云态大模型、混元文生图大模型成、对话式智能助手盘古NLP大模型、盘古CV大模型、盘古科学鹏程云脑、ModelArts“物的银行”、新药研发、气象预测计算大模型语言和图像大模型抖音特效、剪映AI生成、飞书AI助手“MyAI”字节跳动字节跳动大模型火山引擎资料来源:文心大模型官网,通义千问官网,阿里巴巴官网,腾讯太极机器学习平台,鹅厂技术派,华为云,36氪,国信证券经济研究所整理
证券研究报告百度文心大模型模型简述:已拥有NLP、CV、跨模态、行业等多个AI大模型场景
文心大模型拥有多个AI应用场景,文心一言是基于文心NLP大模型的对话式产品。根据官网介绍,文心大模型包含NLP大模型、CV大模型、跨模态大模型、生物计算大模型、行业大模型等,分别可用于语言、图像、跨模态、生物、细分行业等。2023年3月16日,百度正式官宣全新的生成式AI对话应用——文心一言,是文心NLP模型应用下的产品。其能够与人对话互动,回答问题,协助创作。图10:百度文心全景图资料来源:文心大模型官网,国信证券经济研究所整理
百度NLP核心是ERNIE模型。文心NLP大模型面向语言理解、语言生成等NLP场景。百度文心NLP大模型打造了ERNIE模型系列,ERNIE问世于2019年,目前发展至3.0版本。其中语言理解和生成包含ERNIE3.0Tiny、ERNIE3.0、鹏城-百度.文心、ERNIE3.0Zeus,另外文心NLP大模型包含医疗、金融等细分领域ERNIE模型。ERNIE3.0Tiny(轻量级):可用于通用语言理解。ERNIE3.0(百亿级):可用于智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务。鹏城-百度·文心(千亿级):模型参数规模达到2600亿(GPT-3可用于舆情分析、智能创作、文本解析等。1750亿),证券研究报告图11:百度NLP大模型资料来源:文心大模型官网,国信证券经济研究所整理
文心大模型在国内市场格局中较为领先。根据IDC发布《2022中国大模型发展白皮书》,百度文心大模型在市场格局中在产品能力、生态能力、应用能力等方面在国内较为领先。文心一言核心优势是对中文的理解。百度作为中国语境的搜索龙头,拥有有更多的中文语料数据参与训练。比如,文心一言可以针对“洛阳纸贵”这种容易产生歧义的成语,给出较为贴切的解释。可以用成语写出藏头诗,用四川话读出文章。图12:中国大模型市场2022年评估结果——百度资料来源:IDC,国信证券经济研究所整理
模型toC应用:文心一言有望优化C端用户搜索、创作体验
百度已经推出对话式产品文心一言。文心一言可通过对话模式,帮助用户文学创作、商业文案创作、数理推算、中文理解、多模态生成等。例如文心一言发布会上案例,文心一言可以生成2023世界智能交通大会海报,解答“智能交通最适合证券研究报告哪个城市发展”的问题,并用四川话和视频形式展现答案。我们认为,与NewBing类似,百度可以将对话式人工智能功能添加至搜索引擎中,优化用户搜索、创作等体验。当前,在百度APP内,基于文心ERNIE大模型已实现新闻资讯信息的自动分类,新闻标题和摘要的自动生成等功能。图13:文心一言对话演示资料来源:文心一言发布会,国信证券经济研究所整理
模型toB应用:开放API接口赋能企业,精调行业模型
目前,百度开放大模型API接口,在文案、AI作画、开放域对话方面赋能开发者和企业。百度文心大模型开放了NLP大模型ERNIE3.0、ERNIE-ViLG文生图、对话大模型PLATO。ERNIE3.0提供文案改写、开放问答、摘要、文案创作、小说创作、文本补全等文本理解与创作能力。ERNIE-ViLG提供基于文本描述的AI作画能力。PLATO提供生成式开放域对话服务,逻辑清晰、知识多元、情感丰富,闲聊能力接近真人水平。当前已经有650家企业宣布接入文心一言生态,还有更多的企业在排队。据百度介绍,申请文心一言API调用服务测试的企业已突破6.5万。图14:百度文心大模型API资料来源:文心大模型官网,国信证券经济研究所整理
证券研究报告对于具体行业来说,百度也推出文心.行业大模型,进行行业精调。行业大模型是在百度通用大模型的基础上学习行业特色数据与知识,建设行业AI基础设施。图15:百度文心行业大模型原理资料来源:文心大模型官网,国信证券经济研究所整理
百度文心行业大模型以“行业知识增强”为核心特色。目前百度文心行业大模型在能源、金融、航天、制造、传媒、城市、社科以及影视等领域,与国网、浦发、吉利、TCL、人民网、上海辞书出版社等均有案例应用。我们以五个行业场景举例:在燃气行业,“深燃-百度·文心”在环境巡检、安全监控等领域落地,有效解决了场景繁杂、识别困难等难题;在汽车行业,“吉利-百度·文心”应用于售后服务和汽⻋领域知识库构建等场景;在保险行业,“泰康-百度·文心”应用于医疗单据识别等任务,平均字段识别错误率相对下降;在电子制造行业,“TCL-百度·文心”改变了传统质检算法流程,大幅提升了模型研发与运营效率,实现降本增效;在社科行业,“辞海-百度·文心”用于版权保护、词条管理和知识挖掘等方面。证券研究报告图16:文心行业大模型案例资料来源:文心大模型官网,国信证券经济研究所整理
阿里巴巴通义大模型模型简述:由通义-M6模型融合语言模型和视觉模型组成
通义大模型最早发布于2022年9月2日,在阿里达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成,包括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义-视觉大模型”,以及行业层面的不同垂直领域专业模型。图17:阿里巴巴通义大模型系列架构资料来源:机器之心,国信证券经济研究所整理
通义系列前身为M6,是阿里达摩院研发的通用性多模态大模型,特点是训练能耗显著降低。M6自2020年初正式启动研发,于2021年1月/3月/5月分别发布百亿/千亿/万亿参数多模态预训练模型。2021年10月发布十万亿参数模型,并且支持使用512GPU在10天内即训练出具有可用水平的10万亿模型,同等参数下相较于GPT-3能耗降低99%。证券研究报告图18:阿里巴巴通义-M6发展历史资料来源:机器之心,国信证券经济研究所整理
M6融合语言模型和视觉模型,形成当前的通义系列大模型。2022年1月,阿里M6发布了统一大模型M6-OFA,可以实现不同模型之间的模态表示、任务表示、模型结构的统一。以M6-OFA为统一底座,阿里巴巴将另外两大模型“AliceMind”“视觉大模型”与M6进行融合,形成了当前的通义系列架构。其中,通义-AliceMind为深度语言模型体系,包含了通用语言模型StructBERT、生成式PALM、结构化StructuralLM、超大中文PLUG、多模态StructVBERT、多语言VEC等多个不同模型,具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力;通义-视觉大模型包括文本到视觉生成、语言和视觉的模态映射两大基础模型,可以提供文生图等能力。图19:阿里巴巴深度语言模型AliceMind图20:阿里巴巴通义-视觉大模型资料来源:AliceMind,国信证券经济研究所整理资料来源:机器之心,国信证券经济研究所整理
模型应用:率先应用在硬件终端天猫精灵和软件通义千问
硬件终端方面:天猫精灵基于通义大模型推出拟声助手“鸟鸟分鸟”。4月4日,脱口秀演员鸟鸟在微博发布了一条关于天猫精灵的演示视频。根据公司和鸟鸟的介绍,“鸟鸟分鸟”是天猫精灵联合阿里达摩院,基于通义大模型,对鸟鸟录制的一个多小时音频进行学习训练而成。从形态上看,“鸟鸟分鸟”本身是一个对话机器人,具备多轮对话能力,并且还能利用搜索引擎等工具。个性化是“鸟鸟分鸟”最大特点,具备拟人化的音色、语气、表达方式。我们推测,这意味着通用大模型将有可能在表达方式层面实现较低成本的定制化。证券研究报告图21:鸟鸟分鸟基于通义大模型系列图22:鸟鸟分鸟15天训练流程资料来源:机器之心,国信证券经济研究所整理资料来源:机器之心,国信证券经济研究所整理
对话式通义千问已经开始内测,包含9款“百宝袋”小应用。4月7日,阿里云宣布大模型“通义千问”上线,并定向邀请企业用户进行测试。测试版的通义千问与ChatGPT和文心一言在界面上相似,都是采用问答对话的形式。此外,通义千问在对话模式之外,制作了9款称为“百宝袋”的小应用,可以分为三类:1)效率类:写提纲、SWOT分析、商品描述生成;2)生活类:会放飞的菜谱、小学生作文、然后呢;3)娱乐类:彩虹屁专家、写情书、为你写诗。我们认为,未来阿里大模型有望添加至阿里系电商和钉钉等场景中,带动用户体验和效率的提升。图23:阿里巴巴通义千问图24:阿里巴巴通义千问百宝袋资料来源:虎嗅,国信证券经济研究所整理资料来源:虎嗅,国信证券经济研究所整理
腾讯混元大模型模型简述:热启动降低训练成本,文字视频等多领域表现优异
“混元”AI大模型由TEG数据平台部和机器学习平台部联合主导,涵盖计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等方向。“混元”AI大模型由腾讯17级研究员/杰出科学家(腾讯史上最高专业职级)张正友博士带队,2022年4月公司首次披露研发进展,目前已更新至2.0版本。性能上看,“混元”大模型在文字、视频等多个领域表现优异。其中HunYuan-tvr模型在文字和视频在全球最具权威的MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模态视频检索数据集榜单排名第一,实现该领域的大满贯;HunYuan-NLP1T模型在CLUE(中文语言理解评测集合)总榜、分类榜和阅读理解榜排名第一。证券研究报告图25:HunYuan-tvr在5个公开数据集上排名第一资料来源:鹅厂技术派,国信证券经济研究所整理
图26:HunYuan-NLP1T模型在CLUE总榜、分类榜和阅读理解榜登顶资料来源:腾讯太极机器学习平台,国信证券经济研究所整理
技术上看,“混元”大模型基于腾讯太极机器学习平台研发,通过改进模型与算法,大幅降低训练成本。HunYuan利用千亿小模型帮助万亿大模型完成启动,相较从0启动耗时短耗能低,仅用256卡,最快一天内即可完成万亿参数大模型HunYuan-NLP1T的训练,整体训练成本仅为直接冷启动训练万亿模型的1/8。图27:HunYuan大模型及解决方案资料来源:量子位,国信证券经济研究所整理
证券研究报告模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本
腾讯广告业务:腾讯在广告业务中应用AI模型,助力广告主提升广告创作效率、提升广告推荐系统的内容理解能力,大幅提升了广告效率,实现降本增效。在混元AI大模型基础上建立“巨阙”广告内容理解、“乾坤”广告智能创作、“神针”广告智能审核、“天印”广告指纹系统等四大技术平台,提升了广告系统的理解能力,让系统更加智能,从而提高用户体验以及广告转化效果与广告制作效率。图28:腾讯广告多媒体AI技术研究与应用情况资料来源:腾讯云开发者,国信证券经济研究所整理
内容创作:腾讯智能创作助手文涌(Effidit)主要用途是帮助创作者开阔思路、提升创作后的文本水平和质量等,目前已经发布2.0版本。据官方介绍,文涌融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术,部分功能的实现使用“混元”系列AI大模型作为底层预训练模型。图29:腾讯智能创作助手功能一览资料来源:Effidit,国信证券经济研究所整理
游戏业务:腾讯近日提出基于AIBot与AIGC两大方向的自研3D虚拟场景自动生成解决方案,帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市,大幅提升3D虚拟场景的生产效率。以3D虚拟城市道路布局设计为例,现有技术生成的路网通常横平竖直、风格单一,要实现不同城市风格必须手动设计和反复证券研究报告修改,耗时至少一周。腾讯解决方案只需用户输入城市主干道和海岸线,模型1分钟内即可填充合理、多样的路网细节并支持微调操作,相比现有技术下效率提升近100倍。图30:腾讯游戏AI路网生成模型资料来源:腾讯AI实验室,国信证券经济研究所整理
对话式智能助手:腾讯集合集团内资源与顶尖人才,正在全力打造类ChatGPT对话式产品。36氪旗下媒体消息,腾讯类ChatGPT对话式产品项目组——腾讯混元助手项目组(HunyuanAide)于2023年2月已经成立。该项目组联合腾讯内部多部门构建大参数语言模型,目标是通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能助手,并能成为国内的业界标杆,我们预计未来AI只能助手将广泛应用于腾讯系社交产品和办公产品等。图31:腾讯混元助手项目组织架构资料来源:职场Bonus,国信证券经济研究所整理
证券研究报告华为盘古大模型模型简述:基于ModelArts研发设计的系列模型,NLP、CV等方向性能优越
“盘古”大模型由计算机视觉(CV)大模型、科学计算大模型、自然语言处理(NLP)大模型、多模态大模型组成,该模型由华为云人工智能领域首席科学家田奇带领的华为云EI盘古团队主导设计。“盘古”项目自2020年11月起立项,2021年4月在华为开发者大会上首次正式发布,2023年4月8日,团队介绍了盘古模型的应用进展,包括模型在物流、药物研发、气象预测等领域的落地。盘古模型基于华为一站式AI开发平台ModelArts进行研发。ModelArts是华为开发的AI生产线,具备持续构建大模型训练及推理加速能力、分布式训练能力等,并提供数据处理、算法开发、模型训练、模型管理、模型部署等AI应用开发全流程技术能力。图32:盘古模型基于ModelArts平台进行开发设计资料来源:计算机文艺复兴,华为云,国信证券经济研究所整理
模型性能优异,NLP大模型是首个千亿参数级中文大模型,2021年位列CLUE榜单三项第一。2021年4月华为云盘古NLP大模型发布,这是当时业界首个2000亿参数的中文预训练模型。在2021年,盘古NLP模型在中文语言理解评测基准CLUE榜单中总排行榜及分类、阅读理解单项均排名第一,刷新了三项榜单世界历史纪录。盘古CV大模型是业界最大的CV预训练模型。盘古CV大模型包含了30多亿参数和10亿级别的图像,已经在100多个场景中得到了验证。在ImageNet1%、10%数据集上的小样本分类精度上均达到业界最高水平。证券研究报告模型应用:在物流、药物研发、气象等多个场景实现落地,极大提高行业效率
NLP大模型、CV大模型等都是华为L0级别的基础大模型,往上则是L1级别的行业大模型和L2级别的细分场景模型。具体而言,盘古CV大模型目前覆盖了工业质检、物流仓库监控、时尚辅助设计等行业和领域;盘古NLP大模型覆盖了智能文档检索、智能ERP和小语种大模型;盘古科学计算大模型则应用于气象预报、海浪预测等方面。表3:盘古系列模型应用场景和领域盘古系列行业&领域工业质检盘古CV大模型物流仓库监控时尚辅助设计智能文档搜索盘古NLP大模型智能ERP小语种大模型盘古科学计算大模型气象预报,海浪预测场景偏光片质检、铁路TFDS、电力巡检、煤矿质检物的银行门店半定制设计类案检索企业财务异常检测阿拉伯语大模型盘古气象大模型、盘古药物分子大模型资料来源:华为,国信证券经济研究所整理
物流仓库监控:在物流场景,华为盘古团队为浦发银行构建了“物的银行”——普慧云仓。相比于传统的数字银行,它能够更彻底的做到业务流程的线上化,进一步提升效率。华为数据显示,在人员行为、货物检测方面,“物的银行”可以实现5%到10%的性能提升。新药研发:传统模式下,新药研发有周期长、投入大、成功率高的难题,盘古药物分子大模型是专门面向药物研发领域推出的模型,可以帮助医药公司进行AI辅助研发,使得先导药研发周期从数年缩短到1个月,极大改善了新药研发过程的效率。图33:盘古药物分子大模型示意图资料来源:计算机文艺复兴,国信证券经济研究所整理
证券研究报告气象预测:盘古气象大模型的研究团队通过3DEarth-SpecificTransformer的方式处理复杂的不均匀3D气象数据,提高AI大模型的预测精度。盘古气象大模型能够提供秒级的全球气象预报,其气象预测结果包括位势、湿度、风速等,其精度首次超过了欧洲气象中心的数字分析的方法,并且预测速度提升了1万倍以上。图34:3DEarth-SpecificTransformer示意图资料来源:华为云,国信证券经济研究所整理
图35:盘古气象大模型指标表现优异,预测精度超过传统方式资料来源:华为云,国信证券经济研究所整理
字节跳动大模型模型简述:AI探索基础扎实,语言大模型和图像大模型初步布局
字节跳动AIGC大模型将从语言和图像两种模态发力。根据36氪消息,字节跳动证券研究报告在大模型上已有所布局,分别在语言和图像两种模态上发力,预期是在今年年中推出大模型。字节跳动AIGC大模型尚在初期探索阶段,有一定AI基础。根据36氪,在ChatGPT公开前,字节跳动对大模型的投入存疑。但字节跳动在工程团队和云服务团队方面并无短板。1)算力:字节并不缺GPU。字节旗下的企业技术服务平台火山引擎,在2021年正式进军基础云市场(IaaS层),为大模型所需的算力奠定了基础。4月18日,火山引擎发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本。同时,火山引擎宣布与字节跳动国内业务并池,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用。2)算法:阿里巴巴M6大模型的原带头人杨红霞现已加入字节AILab(人工智能实验室),参与语言生成大模型的研发。模型应用:可用于图文、视频内容生成等,飞书将推出智能AI助手“MyAI”
抖音、今日头条基于AIGC生成图文内容。在AIGC的加持下,用户上传照片后,短时间内系统即可自动生成不同风格的图片。例如,抖音上线该“漫画脸”特效后,吸引了大量用户,据抖音平台数据显示,截至2022年12月6日,该特效已经超2428万人使用,并迅速飙升至特效潮流榜TOP1。图36:抖音漫画脸特效资料来源:抖音,机器之心,国信证券经济研究所整理
剪映提供AI生成视频功能。剪映的创作者可以通过几个关键词或一小段文字,生成一段创意小视频。除此以外,剪映可以根据文字描述智能匹配视频素材,将视频包装为更垂直的内容作品,包括财经、历史、人文等类别。证券研究报告图37:剪映AI成片资料来源:剪映,国信证券经济研究所整理
飞书将推出智能AI助手“MyAI”。4月11日字节跳动飞书宣布将推出智能AI助手“MyAI”,MyAI将包括自动汇总会议纪要、创建报告、优化和续写文字内容,在飞书app中,MyAI也可以通过对话形式,帮助用户自动创建日程、搜索公司内部知识库等功能。图38:飞书将推出智能AI助手“MyAI”资料来源:飞书视频号,国信证券经济研究所整理
证券研究报告投资建议ChatGPT的涌现能力的实现以及应用成功,使得AI产业发展进入新阶段。AI大模型增强机器理解能力,可以优化人类与机器交互方式,是效率提升的革命。大模型“预训练+精调”即可对下游应用赋能。当前,各家公司开展新一轮AI模型竞赛,希望借助大模型能力开展“模型即服务”的范式。算力、算法、数据是大模型能否成功的重要因素,我们重点关注在大模型领域有技术储备的国内公司腾讯控股、阿里巴巴、百度等。表4:相关公司盈利预测及估值公司代码0700.HK9988.HK9888.HK公司名称腾讯控股阿里巴巴-SW百度集团-SW投资评级买入买入增持收盘价2022365.494.8129.6
EPS2023E15.76.77.92024E18.07.69.32022261315
PE2023E201214
PB(MRQ)2024E181112
4.31.81.4
12.16.47.4数据来源:wind、国信证券经济研究所预测及整理
风险提示AI技术迭代进度不及预期;AI应用落地进度不及预期;政策风险;供应链风险等。证券研究报告免责声明分析师声明
作者保证报告所采用的数据均来自合规渠道;分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求独立、客观、公正,结论不受任何第三方的授意或影响;作者在过去、现在或未来未就其研究报告所提供的具体建议或所表述的意见直接或间接收取任何报酬,特此声明。国信证券投资评级
类别股票投资评级级别买入增持中性卖出超配中性低配说明股价表现优于市场指数20%以上股价表现优于市场指数10%-20%之间股价表现介于市场指数±10%之间股价表现弱于市场指数10%以上行业指数表现优于市场指数10%以上行业指数表现介于市场指数±10%之间行业指数表现弱于市场指数10%以上行业投资评级重要声明
本报告由国信证券股份有限公司(已具备中国证监会许可的证券投资咨询业务资格)制作;报告版权归国信证券股份有限公司(以下简称“我公司”)所有。本报告仅供我公司客户使用,本公司不会因接收人收到本报告而视其为客户。未经书面许可,任何机构和个人不得以任何形式使用、复制或传播。任何有关本报告的摘要或节选都不代表本报告正式完整的观点,一切须以我公司向客户发布的本报告完整版本为准。本报告基于已公开的资料或信息撰写,但我公司不保证该资料及信息的完整性、准确性。本报告所载的信息、资料、建议及推测仅反映我公司于本报告公开发布当日的判断,在不同时期,我公司可能撰写并发布与本报告所载资料、建议及推测不一致的报告。我公司不保证本报告所含信息及资料处于最新状态;我公司可能随时补充、更新和修订有关信息及资料,投资者应当自行关注相关更新和修订内容。我公司或关联机构可能会持有本报告中所提到的公司所发行的证券并进行交易,还可能为这些公司提供或争取提供投资银行、财务顾问或金融产品等相关服务。本公司的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中意见或建议不一致的投资决策。本报告仅供参考之用,不构成出售或购买证券或其他投资标的要约或邀请。在任何情况下,本报告中的信息和意见均不构成对任何个人的投资建议。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。投资者应结合自己的投资目标和财务状况自行判断是否采用本报告所载内容和信息并自行承担风险,我公司及雇员对投资者使用本报告及其内容而造成的一切后果不承担任何法律责任。证券投资咨询业务的说明
本公司具备中国证监会核准的证券投资咨询业务资格。证券投资咨询,是指从事证券投资咨询业务的机构及其投资咨询人员以下列形式为证券投资人或者客户提供证券投资分析、预测或者建议等直接或者间接有偿咨询服务的活动:接受投资人或者客户委托,提供证券投资咨询服务;举办有关证券投资咨询的讲座、报告会、分析会等;在报刊上发表证券投资咨询的文章、评论、报告,以及通过电台、电视台等公众传播媒体提供证券投资咨询服务;通过电话、传真、电脑网络等电信设备系统,提供证券投资咨询服务;中国证监会认定的其他形式。发布证券研究报告是证券投资咨询业务的一种基本形式,指证券公司、证券投资咨询机构对证券及证券相关产品的价值、市场走势或者相关影响因素进行分析,形成证券估值、投资评级等投资分析意见,制作证券研究报告,并向客户发布的行为。证券研究报告国信证券经济研究所深圳
深圳市福田区福华一路125号国信金融大厦36层邮编:518046上海
上海浦东民生路1199弄证大五道口广场1号楼12层邮编:200135北京
北京西城区金融大街兴盛街6号国信证券9层邮编:100032
因篇幅问题不能全部显示,请点此查看更多更全内容