¿Qué tan bueno es Midjourney en AI Art? Comparamos todos los modelos
Publicado: 2023-05-20Podría decirse que MidJourney es la herramienta de generación de arte de IA más fácil tanto en términos de uso como en términos de obtener resultados sorprendentes, pero es fácil olvidar que no fue tan impresionante en el lanzamiento. ¡Veamos hasta dónde ha llegado!
Nuestra Metodología
MidJourney funciona aceptando "indicaciones" de texto que describen qué tipo de imagen desea que genere a través de la aplicación Discord. Si desea aprender a usar el software, hay muchas guías increíbles de MidJourney en la web que lo pondrán en funcionamiento en muy poco tiempo. Para este artículo, nos enfocamos en comparar cuánto ha mejorado la tecnología de MidJourney en los 15 meses entre V1 y V5.1, que es el último en el momento de escribir este artículo.
RELACIONADO: ¿Qué puedes hacer con el arte generado por IA?
MidJourney le permite cambiar manualmente entre cualquiera de sus versiones de modelo usando /settings
que le dará estas opciones.
Aquí podemos seleccionar entre las diferentes versiones de MidJourney. Por cierto, las opciones “Niji” son modelos entrenados específicamente para generar imágenes al estilo Anime y Manga japonés, así que si eso es lo tuyo, pruébalos.
Todas las imágenes generadas para este artículo usarán la configuración de Alta calidad, con el nivel de estilo predeterminado, que determina qué tan estricto o flexible se comporta el modelo cuando sigue el mensaje.
Usaremos las mismas cinco indicaciones con cada modelo para que pueda hacer una comparación directa. No utilizaremos ningún parámetro especial de MidJourney y nos ceñiremos a las indicaciones de texto sin formato en inglés sencillo.
Usamos ChatGPT-4 para crear cinco indicaciones para probar MidJourney, que representan una variedad de desafíos. Estas son las indicaciones que estamos usando:
- Pintura al óleo de un paisaje surrealista
- Foto de una concurrida calle del centro en la década de 1920
- Arte conceptual de un paisaje urbano futurista en la noche
- Cuadro de un tigre blanco en la nieve
- Retrato de una mujer sorprendida
MidJourney proporciona cuatro imágenes en respuesta a cada indicación. Elegiremos el que (en nuestra opinión) es el mejor de los cuatro para presentar aquí para comparar. Entonces, veamos cuánto ha mejorado en el poco tiempo que ha existido.
Midjourney V1 (febrero de 2022)
Estamos firmemente en el reino del combustible de pesadillas de ensueño con V1 de MidJourney. De un vistazo rápido, estas imágenes te dan la impresión de lo que son, pero tan pronto como las miras, todo se desmorona. Los rostros humanos son particularmente inquietantes.
RELACIONADO: Dejamos que ChatGPT cree AI Art, esto es lo que hizo
MidJourney V2 (12 de abril de 2022)
V2 no parece un gran salto sobre V1, pero hay una mejora definitiva en la composición, especialmente notable en la escena callejera de la década de 1920. El tigre blanco definitivamente tiene un contorno mejor que antes, y el rostro de la mujer es un poco menos espeluznante.
Observe cómo, en algunas imágenes, hay una especie de pseudo-firma en la pieza. Esto se debe a que la IA ha aprendido que las imágenes de ciertos estilos tienen firmas, por lo que trató de reproducir algo que se parece a uno.
MidJourney V3 (25 de julio de 2022)
Con V3 definitivamente estamos viendo una mejora significativa en coherencia y composición. Los detalles están claramente apagados sin demasiado escrutinio, pero la cantidad de ruido aleatorio definitivamente se reduce y las imágenes tienen más sentido para el ojo humano.
MidJourney V4 (5 de noviembre de 2022)
¡Ahora estamos hablando! V4 muestra una mejora dramática en la composición, los detalles y cuán dinámicas e imaginativas son las imágenes. Poco más de medio año desde la V1, y estas imágenes definitivamente están en el ámbito de la usabilidad, a menudo tal como son sin más edición. Se necesita mucho más escrutinio para detectar fallas reveladoras de IA.
MidJourney V5 (15 de marzo de 2023)
Las mejoras con V5 son un poco más sutiles que antes, pero son sustanciales. Además de la mejora técnica en los detalles y la composición, estas piezas parecen más “imaginativas”, con aún más dinámicas, opciones más amplias de colores y, en general, una presentación mucho más agradable. Aunque V4 ciertamente movió las imágenes resultantes a la zona gris entre la mejor competencia técnica humana y lo que puede hacer la generación de IA, V5 hace que sea prácticamente imposible decir que estas imágenes están hechas por IA cuando MidJourney está funcionando a toda máquina.
RELACIONADO: Lo siento, AI Art, su algoritmo no puede reemplazar la creatividad humana
V5 también se destaca por abordar uno de los mayores problemas en la generación de imágenes de IA: ¡las manos!
La imagen de arriba de V5 muestra que el problema se ha resuelto en general, aunque aquí todavía se puede ver que a una de las manos le falta el dedo meñique o simplemente está oscurecida. Los casos extremos como estos todavía se deslizan, pero parece que los días de las personas con manos de 7 dedos casi han terminado.
MidJourney V5.1 (3 de mayo de 2023)
Si bien la última actualización del modelo que estamos viendo aquí puede ser solo una actualización ".1", ciertamente no hay duda de la mejora. Sobre la base de los fundamentos de V5, V5.1 pule los defectos menores de V5 mientras que, a nuestro juicio, muestra una mejora inconfundible en la expresión y el estilo artístico general.
Es difícil imaginar adónde puede ir MidJourney desde aquí, pero la cantidad de progreso hasta ahora es simplemente alucinante, y estamos ansiosos por ver qué es posible a continuación.
RELACIONADO: Cómo crear arte sintético de IA con Midjourney