人工智能艺术的中途有多好? 我们比较了所有模型
已发表: 2023-05-20MidJourney 可以说是最简单的 AI 艺术生成工具,无论是使用它还是获得惊人的结果,但很容易忘记它在发布时并不是那么令人印象深刻。 让我们看看它有多远!
我们的方法论
MidJourney 的工作原理是接受描述您希望它通过 Discord 应用程序生成哪种图像的文本“提示”。 如果您想了解如何使用该软件,网上有许多很棒的 MidJourney 指南,可以让您立即上手并运行。 对于本文,我们重点比较 MidJourney 的技术在 V1 和 V5.1 之间的 15 多个月内有多少改进,这是撰写本文时最新的版本。
相关:你能用 AI 生成的艺术做什么?
MidJourney 允许您使用/settings
在其任何模型版本之间手动切换,这将为您提供这些选项。
在这里,我们可以在不同的 MidJourney 版本之间进行选择。 顺便说一句,“Niji”选项是经过专门训练以生成日本动漫和漫画风格的图像的模型,所以如果你喜欢,请尝试一下。
为本文生成的所有图像都将使用高质量设置和默认样式级别,这决定了模型在遵循提示时的行为是严格还是宽松。
我们将对每个模型使用相同的五个提示,以便您可以进行直接比较。 我们不会使用任何特殊的 MidJourney 参数,并且会坚持使用纯英语的纯文本提示。
我们使用 ChatGPT-4 提出了五个提示来测试 MidJourney,代表了各种挑战。 这些是我们正在使用的提示:
- 超现实主义风景油画
- 20 年代繁忙的市中心街道照片
- 夜间未来派城市景观的概念艺术
- 白虎雪地画
- 一个惊讶的女人的画像
MidJourney 会针对每个提示提供四张图片。 我们将选择(在我们看来)是四个中最好的一个来进行比较。 因此,让我们看看它在短时间内改进了多少。
中途 V1(2022 年 2 月)
MidJourney 的 V1 使我们坚定地处于梦幻般的噩梦燃料领域。 快速浏览这些图像会给您留下它们的印象,但是一旦您真正看到它们,一切都会崩溃。 人脸尤其令人不安。
相关:我们让 ChatGPT 创造 AI 艺术,这就是它所做的
MidJourney V2(2022 年 4 月 12 日)
V2 似乎与 V1 相比没有太大的飞跃,但在构图上有明显的改进,在 20 年代的街景中尤其明显。 白虎的轮廓绝对比之前更好了,女人的脸也少了几分诡异。
请注意,在某些图像中,作品上有一种伪签名。 这是因为 AI 了解到某些风格的图像具有签名,因此它试图复制看起来像的东西。
MidJourney V3(2022 年 7 月 25 日)
使用 V3,我们肯定会看到连贯性和合成方面的显着改进。 无需过多检查,细节就很明显了,但随机噪声的数量确实减少了,图像对人眼来说更有意义。
MidJourney V4(2022 年 11 月 5 日)
现在我们在说话! V4 在构图、细节以及图像的动态和想象力方面都有显着改善。 V1 发布仅半年多,这些图像绝对处于可用性范围内,通常与未经进一步编辑的图像一样。 要找出明显的 AI 缺陷,需要进行更多的审查。
MidJourney V5(2023 年 3 月 15 日)
V5 的改进比以前更微妙,但它们是实质性的。 除了在细节和构图上的技术改进外,这些作品看起来更“富有想象力”,具有更多的动态,更广泛的颜色选择,并且整体呈现更令人愉悦。 尽管 V4 确实将生成的图像移到了人类最佳技术水平和 AI 生成能力之间的灰色地带,但当 MidJourney 全力以赴时,V5 几乎无法判断这些图像是 AI 制作的。
相关:对不起,人工智能艺术,你的算法无法取代人类的创造力
V5 还以解决 AI 图像生成中最大的问题之一而著称:手!
上面来自 V5 的图片显示问题已大体上得到解决,尽管在这里您仍然可以看到其中一只手的小拇指可能缺失,或者只是被遮住了。 像这样的边缘案例仍然存在,但似乎有 7 根手指的人的日子可能快结束了。
MidJourney V5.1(2023 年 5 月 3 日)
虽然我们在这里看到的最后一个模型更新可能只是一个“.1”更新,但肯定没有错误的改进。 在 V5 的基础上,V5.1 完善了 V5 中的小缺陷,同时在我们看来,在表达和整体艺术风格上显示出明显的改进。
很难想象 MidJourney 从这里可以走向何方,但到目前为止的进展量简直令人惊叹,我们迫不及待地想看看接下来会发生什么。
相关:如何使用 Midjourney 创建合成 AI 艺术