单选题 大模型的“参数共享”技术主要作用是?( )

A、 增加模型的参数量
B、 减少模型的参数量和计算量
C、 提高模型的训练速度
D、 增强模型的泛化能力
下载APP答题
由4l***i2提供 分享 举报 纠错

相关试题

单选题 以下哪项不属于大模型预训练阶段常用的学习方式?( )

A、自监督学习
B、监督学习
C、对比学习
D、掩码语言模型学习

单选题 GPT 系列模型生成文本时,通常采用的方式是?( )

A、双向预测文本片段
B、从左到右依次预测下一个 token
C、同时生成所有文本内容
D、基于图像内容生成对应的文本

单选题 以下哪种技术可以帮助大模型在保护数据隐私的前提下进行训练?( )

A、知识蒸馏
B、联邦学习
C、微调
D、提示工程

单选题 大模型的“幻觉”现象指的是?( )

A、模型生成内容时出现乱码
B、模型生成看似合理但与事实不符的内容
C、模型无法处理过长的输入文本
D、模型训练过程中出现的参数异常

单选题 以下哪项不是 Transformer 架构的核心组成部分?( )

A、自注意力机制
B、循环神经网络层
C、前馈神经网络
D、层归一化

单选题 以下哪种技术可以在不显著降低模型性能的前提下,减小大模型的计算量和存储需求?( )

A、增加训练数据量
B、知识蒸馏
C、提高学习率
D、延长训练时间

单选题 大模型训练过程中,“过拟合”现象通常是指?( )

A、模型在训练数据和测试数据上表现都很差
B、模型在训练数据上表现好,在新数据上表现差
C、模型参数数量过多导致计算缓慢
D、模型无法收敛到最优解

单选题 提示工程中,“思维链提示”主要用于提升大模型的哪项能力?( )

A、文本生成速度
B、复杂推理能力
C、多语言翻译精度
D、图像识别准确率