宏平均(macro-average)和微平均(micro-average)是评估分类模型性能的两种常用方法。宏平均先计算每个类别的指标(如精确率、召回率、F1值),再对所有类别的结果取算术平均。它对所有类别平等对待,适合类别均衡的数据集。微平均则汇总所有类别的预测结果(如总TP、FP、FN等),再计算整体指标。它更关注样本数量多的类别,适合类别不平衡的数据集。简言之,宏平均重视每个类别的独立表现,而微平均侧重整体数据的统计结果。