LoRA 第120页
LoRA(Low-Rank Adaptation)是一种用于自然语言处理任务的模型压缩技术,通过学习低秩矩阵来适应特定任务,以减少模型大小并提高效率。