图片来源:由无界 AI 生成
距离 Midjourney v5 发布已经过去了半年时间,下一个重大版本 v6 什么时候发布?答案是:今年晚些时候。
Midjourney 首席执行官 David Holz 在昨日的活动中表示,Midjourney v5 到 v6 的飞跃将大于 v4 到v5 的飞跃。不过,Holz 没有给出确切的发布日期,但表示很快就会发布,总之肯定是今年。
对于Midjourney v6 会带来哪些新的东西,Holz 承诺会带来更好的文本理解,即图像生成将更接近提示的描述,并更好地记录提示措辞中的细节,也可能会带来文本渲染功能。
Holz说这些“并不难”。 但他也表示,他还没有看到很好的文本渲染,并且对于该功能是否会有以及达到何种效果程度仍持开放态度。
OpenAI 向 Midjourney 发起挑战,Midjourney 要用 V6 迎战
OpenAI 上周发布了新版本的图像生成大模型 DALL-E 3。DALL-E 是最早的一批生成式 AI 大模型,比 Midjourney 更早。DALL-E 3 版本在各个方面都进行了大幅提升。很多人甚至认为 DALL-E 3 将对 Midjourney 构成直接威胁,在一些方面甚至已经超越了 Midjourney,尤其是 DALL-E 3 与 ChatGPT 结合之后对提示词的理解,对细节的理解,正在超越 Midjourney。
当被问及 OpenAI 的 DALL-E 3 的发布时,Holz “非常乐观”地认为 Midjourney 将继续提供最高的图像质量。 DALL-E 3 和 Midjourney v5 的第一次比较表明,DALL-E 3 在图像质量方面并没有那么领先,但它确实更好地遵循提示并可以渲染文本。
Midjourney v6 会带来哪些新东西?
3D 和视频
Midjourney 的路线图上还包括创建 3D 图像和视频的功能。 尤其是对于 3D 图像,Holz “非常乐观”,认为事情很快就会出现转折点。
当他审视当前的视频游戏时,他说他对图像质量的糟糕程度以及生成式 AI 对质量的贡献之大感到惊讶。 Holz 过去曾表示,他预计未来视频游戏将是生成的,而不是渲染的。3D 图像功能对于 VR、AR 游戏创建者将会是一大福音。
Midjourney 今年不打算发布任何有关 3D 生成的具体信息或演示。 Midjourney 团队正在开发的视频生成也是如此,但 Holz 表示,视频生成可能比 3D 要晚,还没有做好准备。
更高的分辨率
Midjourney 目前最大的缺点之一是生成的图像分辨率相当低。 当前默认图像尺寸为 1,024 x 1,024 像素。 其他宽高比也可用,但它们不会提高 72ppi 的分辨率。 例如,16:9 图像的分辨率只能达到 1,456 x 816 像素。
这种分辨率通常适合网络发布,但不足以进行任何大尺寸的打印。 因此,更高分辨率支持是一个急需解决的用户需求。
其他方面的更新
新的 Niji 风格
Midjourney 团队同时还正在开发新的 Niji 风格。这款二次元模型在上线之后受到了二次元爱好者的一致好评,新的 Niji 模型预计也将带来大量升级改进。
新的网站
Midjourney 的 web 版本仍在开发中。 新 web 版本将分两个阶段推出:
第一阶段:能够查看、搜索自己的图像等
第二阶段:将具有图像创建和社交功能
但对于上线时间,Holz 没有提供具体的时间表。