单选题 某公司打算通过量化来减少模型推理时的内存占用,在量化时量化预训练的浮点模型,并使用部分训练数据来校准模型,这是采用了哪种压缩方式?

A、 模型剪枝
B、 训练后量化(PTQ)
C、 知识蒸馏
D、 量化感知训练(QAT)
下载APP答题
由4l***sn提供 分享 举报 纠错

相关试题

单选题 John在处理一些任务时使用了几块不同的芯片(CPU、GPU、NPU),以下关于对硬件使用描述中,正确的是哪一个选项?

A、在IO密集型任务中适合使用NPU
B、在逻辑推理、复杂数学运算任务中适合使用CPU
C、在图形渲染、深度学习模型训练任务中适合使用GPU
D、在实时性要求高的任务中适合使用CPU

单选题 MindX包括多个组件,提供了集群调度、边缘推理、应用快速开发等功能,其中哪个组件提供了开源模型下载功能?

A、MindX SDK
B、MindX Edge
C、ModelZoo
D、MindX DL

单选题 大模型拥有众多应用场景,以下哪一个选项不属于自然语言处理领域?

A、机器翻译
B、语音识别
C、情感分析
D、文本摘要

单选题 某工程师想要通过微调大模型构建一个业务问答机器人,在实现过程中不需要考虑以下哪个问题?

A、模型幻觉问题
B、预训练数据集编码问题
C、并行训练策略选择
D、推理延时过高

单选题 John目前正在规划建设数据中心,以下哪个系统或设备是他在L2建设时需要考虑的?

A、供电系统
B、网络设备
C、云管理平台
D、制冷系统

单选题 CANN是华为针对AI场景推出的异构计算架构,包含多个组件,其中负责提供异构算子库的是以下哪一个?

A、对异构计算基础层
B、对异构计算服务层
C、对异构计算语言层
D、对异构计算应用层

单选题 某公司打算部署一个13B的大模型用于对外提供服务,已知服务器显存为32G,为了保证尽可能高的模型准确率,他可以采用以下哪种精度的模型?

A、INT8
B、BF16
C、FP16
D、FP32

单选题 大模型存储分布式组网中的常见协议不包含以下哪一项?

A、FC
B、RoCE
C、FoCE
D、SCSI