PyTorch快速微调量化的一个例子

judy 在周一, 02/21/2022 - 17:26 提交

描述
训练好的模型在部署过程中的Vitis AI转换过程要经过优化、量化和编译等步骤。

尤其是量化，可以通过三种不同的方式实现。

训练后量化 ：最简单的量化方法包括两个步骤。"校准"，确定张量的量化步骤，以及量化模型的实际部署。

快速微调量化 ：这是一种基于AdaQuant算法的更复杂的方法，它不仅可以校准激活，而且还可以微调权重。这种方法可以达到比训练后量化更好的性能。与前一种方法一样，它从一个已经训练好的模型开始。

量化意识训练（QAT） ：顾名思义，模型在量化后被训练出最佳性能。

在此答复记录中，快速微调量化应用于 Pytorch上已有的教程。

该设计是用Vitis AI 2.0开发的，UG1414 v2.0中的指南是强制性的。

解决方法
解压附件中的文件，并在教程中的训练步骤后，使用以下命令运行它。

# first step: calibration and finetuning
python -u fast_finetune_quant.py --quant_mode calib
# second step: test and model deployment
python -u fast_finetune_quant.py --quant_mode test  --deploy

100557880-243491-fastfinetunequant.zip

PyTorch

Vitis-AI

本文讲述如何在根文件系统 (rootfs) 中添加自定义配方和层以及如何在其中包含多个程序包。

Vitis HLS 系列 2：Vivado IP 流程 (Vitis Unified)

这篇博客是在上一篇博客 Vitis HLS 系列 1 的基础上撰写的，但使用的是 Vitis Unified IDE，而不是之前传统版本的 Vitis HLS。

QDMA Subsystem for PCI Express v5.0 产品指南

AMD QDMA Subsystem for PCI Express（ PCIe® ）旨在利用多队列的概念实现高性能 DMA，以搭配 PCI Express® Integrated Block 一起使用

ZU+RFSoC之RFDC IP使用

RFDC这个IP，是RFSoC系列中ADC、DAC的核心。这个IP和PL的资源有互联通道，和ARM相对是独立的。

使用 Vitis 进行数据中心加速用户指南

本指南的目标是介绍关键概念，并提供一条途径以供您使用基于 FPGA 的 AMD Alveo 加速器卡、 AMD Vitis 编译器和统一集成设计环境来开始应用加速。

智多晶EthMAC IP介绍

EthMAC是西安智多晶微电子有限公司在2024年基于IEEE802.3-2008 协议clause 3章节开发的通信IP。

如何修改DisplayPort EDID

在最新的DisplayPort 1.4 RX Subsystem IP GUI界面, 有使能Video EDID的选项, 如下：

AIE PLIO 简介

AIE graph通过PLIO与PL(programable logic)连接, 以交换数据, PLIO既可以通过DMA S2MM或者MM2S连接到AI Engine的buffer