大模型预训练阶段常用的优化策略包括？ - 考试宝

多选题大模型预训练阶段常用的优化策略包括？

A、动态掩码（Dynamic Masking）

B、梯度累积（Gradient Accumulation）

C、权重共享（Weight Tying）

D、数据并行（Data Parallelism）

下载APP答题

由4l***77提供分享举报纠错

相关试题

单选题思维链（Chain-of-Thought）提示的核心价值是？

A、降低模型计算开销

B、显式引导模型分步推理

C、替代微调过程

D、增强视觉特征提取

单选题在基于大语言模型的Function Call机制中，以下哪个描述最准确地反映了其核心工作原理？

A、大语言模型直接执行函数代码，并将执行结果返回给用户

B、大语言模型根据用户输入生成符合JSON Schema规范的结构化数据，由外部程序负责实际的函数执行

C、Function Call本质上是一种提示工程技术，通过特殊的prompt格式让模型输出预定义的响应模板

D、大语言模型通过训练学会了所有可能的函数实现，能够模拟各种API的行为

多选题以下哪些是大模型在商业落地中需要重点考虑的非技术因素？

A、数据隐私与合规性

B、用户交互体验设计

C、推理服务的API响应延迟

D、业务场景的ROI（投资回报率）分析

单选题大模型训练中缩放法则（Scaling Laws）主要描述什么关系？

A、计算量、参数量与模型性能的幂律关系

B、模型参数量与训练数据量的线性关系金具

C、模型层数与推理速度的反比关系

D、数据质量与损失函数的指数关系

单选题在一个典型的RAG系统中，如果用户的查询意图模糊（例如“告诉我关于那个新功能的事”），系统最应该先执行什么高级操作来提升最终答案的准确率？

A、直接将问题向量化，在知识库中进行最大范围的暴力检索

B、对查询进行重写或分解，将其转化为更精确、更具体的子问题再进行检索

C、增加召回文档的数量（Top-K），让语言模型一次性处理更多信息

D、立即要求用户提供更多关键词，拒绝回答模糊问题

单选题在设计具有长期记忆能力的智能体时，以下哪种记忆架构最能有效平衡记忆容量、检索效率和遗忘机制？

A、基于关系数据库的结构化记忆存储，使用SQL查询进行精确匹配检索

B、单一向量数据库存储所有记忆，使用余弦相似度进行语义检索

C、分层记忆架构：工作记忆(向量存储) + 情节记忆(时序图数据库) + 语义记忆(知识图谱) + 程序记忆(规则引擎)

D、基于Transformer注意力机制的全连接记忆网络，动态权重分配

多选题以下哪些是使用RAG技术能为企业或个人应用带来的主要优势？

A、减少模型产生“幻觉”的可能性，让回答基于事实

B、彻底取代对模型进行微调（Fine-Tuning）的需求

C、能够利用最新的或私有的知识进行回答，提高了知识时效性和专业性

D、模型的回答有据可循，提高了系统的可解释性和可信度

单选题 RAG技术主要解决了大型语言模型（LLM）的什么核心问题？

A、提升模型的代码生成能力

B、加快模型的推理速度

C、降低模型训练所需的计算资源

D、允许模型连接外部、动态的知识源，以减少幻觉并提高时效性