-
量子位:大模型被偷家了?腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer
在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。 腾讯AI实验室与港中文联合团队提出了一种新的CNN架构,图像识别精度和速度都超过了Transformer架构模型。 切换到点云、音频、视频等其他模态,也无需改变模型结构,简单预处理即可接近甚至超越SOTA。 团队提出了专门用于大核CNN架构设计的四条guideline和一种名为UniRepLKNet的强力backbone。 只要用ImageNet-22K对其进行预训练,精度和速度就都能成为SOT…