单选题 以下哪种分词方法通过删除词元来达到预定义的词表大小?
A、BPE分词
B、WordPiece分词
C、Unigram分词
D、基于词汇的分词
单选题 在大语言模型的预训练数据中,以下哪种数据源通常占比最大?
A、网页数据
B、书籍数据
C、代码数据
D、对话文本数据
单选题 Transformer模型的核心创新技术是什么?
A、多头自注意力机制
B、循环神经网络
C、卷积神经网络
D、前馈网络
单选题 在预训练语言模型(PLM)阶段,BERT模型采用了哪种Transformer架构?
A、仅有编码器的Transformer架构
B、仅有解码器的Transformer架构
C、编码器-解码器的Transformer架构
D、双向LSTM架构
单选题 大语言模型(LLM)的哪个能力特点使其能够通过自然语言描述直接执行任务指令?
A、丰富的世界知识
B、通用任务解决能力
C、复杂任务推理能力
D、人类指令遵循能力
单选题 Transformer模型中,哪种位置编码方法被广泛用于建模长序列数据?
A、绝对位置编码
B、旋转位置编码
C、相对位置编码
D、ALiBi
单选题 在语言模型的发展历程中,哪个阶段的模型首次引入了分布式词表示的概念?
A、统计语言模型
B、神经语言模型
C、预训练语言模型
D、大语言模型
单选题 在数据调度中,以下哪种策略通常用于增强大语言模型的特定能力?
A、增加数据源的多样性
B、数据混合策略
C、数据课程
D、优化特定能力