生成式人工智能行业专题研究：海外大模型篇：生成式AI加速创新，行业迎历史性机遇

www.eastmoney.com 国元证券耿军军查看PDF原文

领涨个股	名称	相关	涨跌幅

资金流入	名称	相关	净流入(万)

　　第一部分：生成式AI快速发展，技术奇点有望到来

　　第二部分：技术创新百花齐放，海外巨头引领创新

　　第三部分：风险提示

　　1.1发展历程：算法模型持续迭代，AI行业快速发展

　　1基础的生成算法模型是驱动AI的关键

　　2014年，伊恩·古德费洛(lanGoodfellow)提出的生成对抗网络(GenerativeAdversarialNetwork,GAN)成为早期最为著名的生成模型。GAN使用合作的零和博弈框架来学习，被广泛用于生成图像、视频、语音和三维物体模型。随后，Transformer、基于流的生成模型(Flow-basedmodels)、扩散模型(DiffusionModel)等深度学习的生成算法相继涌现。

　　Transformer模型是一种采用自注意力机制的深度学习模型，这一机制可按输入数据各部分的重要性分配权重，可用于自然语言处理(NLP)、计算机视觉(CV)领域应用，后来出现的BERT、GPT-3、laMDA等预训练模型都是基于Transformer模型建立的。

　　通过梳理全球主流大语言模型(LLM)的发展脉络，2018年以来的GPT系列、LLaMA系列、BERT系列、Claude系列等多款大模型均发源于Transformer架构。

　　2预训练模型引发了AI技术能力的质变

　　预训练模型是为了完成特定任务基于大型数据集训练的深度学习模型，让AI模型的开发从手工作坊走向工厂模式，加速AI技术落地。

　　2017年，Google颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构，奠定了大模型预训练算法架构的基础。

　　2018年，OpenAI和Google分别发布了GPT-1与BERT大模型，意味着预训练大模型成为自然语言处理领域的主流。

　　3预训练数据直接决定AI大模型性能

　　ScalingLaws：模型容量、数据量、训练成本共同构成了大模型训练的不可能三角。大模型训练的目标是最大化模型性能，模型训练成本（GPU的数量和训练时间等）是受限的，因此一般通过增加数据集大小和增加模型中的参数量两种途径来提升模型性能。

今日最新研究报告查看PDF原文

郑重声明：东方财富发布此内容旨在传播更多的信息，与本站立场无关，不代表东方财富观点。建议用户在阅读研报过程中，请认真仔细阅读研报里的风险提示、免责声明、重要声明等内容，用户据此操作风险自担。

文中涉及到的个股

最新研究报告

点击查看全部>>

热门个股评级一览

个股未来3年盈利预测

个股财务指标排行榜

以下数据基于个股最新报告期

热门行业追踪

数据来源：东方财富Choice数据

郑重声明：东方财富网发布此信息的目的在于传播更多信息，与本站立场无关。东方财富网不保证该信息（包括但不限于文字、视频、音频、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实，不对您构成任何投资建议，据此操作，风险自担。

东方财富

扫一扫下载APP

东方财富产品

证券交易

关注东方财富

天天基金

扫一扫下载APP

基金交易

关注天天基金

期货交易

信息网络传播视听节目许可证：0908328号经营证券期货业务许可证编号：913101046312860336 违法和不良信息举报:021-61278686 举报邮箱：jubao@eastmoney.com

关于我们可持续发展广告服务供应商平台联系我们诚聘英才法律声明隐私保护征稿启事友情链接

亲爱的市民朋友，上海警方反诈劝阻电
话“962110”系专门针对避免您财产被
骗受损而设，请您一旦收到来电，立即
接听。