阿里通义发布首个开源图像生成模型Qwen-Image,阿里chart
2025年8月5日消息,阿里通义大模型发布最新图像生成基础模型Qwen-Image,为200亿参数的MMDiT多模态扩散 Transformer模型,该模型是通义千问系列首个图像生成基础模型。
Qwen-Image擅长复杂中文渲染、复杂英文渲染,在多个文本测评榜单中,文字渲染均获得SOTA。功能方面,支持中英双语,多变字体,超长段落,超小文字,并可实现复杂的多位置图文布局。
生成作品案例:宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着 “阿里云” 卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着 “云存储” 的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着 “云计算” 的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着 “云模型” 的牌子,门口放着一个大酒缸,上面写着 “千问”,一位老板娘正在往里面倒发光的代码溶液。
1、我控糖控得还不错,这些年除了不暴饮暴食、猛吃甜食外,平时基本不忌口了
2、SK海力士打算提高HBM4定价:幅度达70%,利用提前交货优势提高溢价
3、部分中国留学生赴海外考公,这是个好选择吗?,海外留学生可以参加公务员考试吗