阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用

阿里大模型又开源!能读图会识物,基于通义千问7B打造,可商用
  继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。
  
  具体来说,Qwen-VL是基于通义千问-7B打造的多模态大模型,支持图像、文本、检测框等多种输入,并且在文本之外,也支持检测框的输出。

上一篇:

下一篇: