阿里大模型又开源！能读图会识物，基于通义千问7B打造，可商用

阿里大模型又开源！能读图会识物，基于通义千问7B打造，可商用
　　继通义千问-7B（Qwen-7B）之后，阿里云又推出了大规模视觉语言模型Qwen-VL，并且一上线就直接开源。
　　
　　具体来说，Qwen-VL是基于通义千问-7B打造的多模态大模型，支持图像、文本、检测框等多种输入，并且在文本之外，也支持检测框的输出。