efficientvit-模型基本分类

常用的模型分类解释

模型名 基本解释
efficientvit-sam-xx 图像交互式分割
efficientvit-l2-r224 b代表baseline的基础模型
l代表large的高精度大型模型
r224 = 224×224像素输入

其中的 b1 b2 b3的含义分别是:

模型 参数量 MACs ImageNet精度 推理速度
B1 9.1M 0.52G 79.39% 最快
B2 24M 1.6G 82.10% 中等
B3 49M 4.0G 83.47% 较慢
级别 参数量 ImageNet精度 主要用途
L1 53M 84.48% 通用高精度分类
L2 64M 85.05% 平衡性能与精度
L3 246M 86.41% 最高精度要求