多选题 大模型预训练阶段常用的优化策略包括?

A、 动态掩码(Dynamic Masking)
B、 梯度累积(Gradient Accumulation)
C、 权重共享(Weight Tying)
D、 数据并行(Data Parallelism)
下载APP答题
由4l***77提供 分享 举报 纠错

相关试题

单选题 思维链(Chain-of-Thought)提示的核心价值是?

A、降低模型计算开销
B、显式引导模型分步推理
C、替代微调过程
D、增强视觉特征提取

单选题 在基于大语言模型的Function Call机制中,以下哪个描述最准确地反映了其核心工作原理?

A、大语言模型直接执行函数代码,并将执行结果返回给用户
B、大语言模型根据用户输入生成符合JSON Schema规范的结构化数据,由外部程序负责实际的函数执行
C、Function Call本质上是一种提示工程技术,通过特殊的prompt格式让模型输出预定义的响应模板
D、大语言模型通过训练学会了所有可能的函数实现,能够模拟各种API的行为

多选题 以下哪些是大模型在商业落地中需要重点考虑的非技术因素?

A、数据隐私与合规性
B、用户交互体验设计
C、推理服务的API响应延迟
D、业务场景的ROI(投资回报率)分析

单选题 大模型训练中缩放法则(Scaling Laws)主要描述什么关系?

A、计算量、参数量与模型性能的幂律关系
B、模型参数量与训练数据量的线性关系金具
C、模型层数与推理速度的反比关系
D、数据质量与损失函数的指数关系

单选题 在一个典型的RAG系统中,如果用户的查询意图模糊(例如“告诉我关于那个新功能的事”),系统最应该先执行什么高级操作来提升最终答案的准确率?

A、直接将问题向量化,在知识库中进行最大范围的暴力检索
B、对查询进行重写或分解,将其转化为更精确、更具体的子问题再进行检索
C、增加召回文档的数量(Top-K),让语言模型一次性处理更多信息
D、立即要求用户提供更多关键词,拒绝回答模糊问题

单选题 在设计具有长期记忆能力的智能体时,以下哪种记忆架构最能有效平衡记忆容量、检索效率和遗忘机制?

A、基于关系数据库的结构化记忆存储,使用SQL查询进行精确匹配检索
B、单一向量数据库存储所有记忆,使用余弦相似度进行语义检索
C、分层记忆架构:工作记忆(向量存储) + 情节记忆(时序图数据库) + 语义记忆(知识图谱) + 程序记忆(规则引擎)
D、基于Transformer注意力机制的全连接记忆网络,动态权重分配

多选题 以下哪些是使用RAG技术能为企业或个人应用带来的主要优势?

A、减少模型产生“幻觉”的可能性,让回答基于事实
B、彻底取代对模型进行微调(Fine-Tuning)的需求
C、能够利用最新的或私有的知识进行回答,提高了知识时效性和专业性
D、模型的回答有据可循,提高了系统的可解释性和可信度

单选题 RAG技术主要解决了大型语言模型(LLM)的什么核心问题?

A、提升模型的代码生成能力
B、加快模型的推理速度
C、降低模型训练所需的计算资源
D、允许模型连接外部、动态的知识源,以减少幻觉并提高时效性