El fundador de Midjourney, David Holz, sobre el impacto de la IA en el arte, la imaginación y la economía creativa

a mitad de camino es uno de los principales impulsores de la tecnología emergente del uso de inteligencia artificial (IA) para crear imágenes visuales a partir de indicaciones de texto. La startup con sede en San Francisco recientemente fue noticia como el motor detrás de la obra de arte que ganó un premio en una competencia justa estatal de Colorado, y es poco probable que ese sea el último problema complicado que enfrentará el arte de IA en los próximos años.

Midjourney se diferencia de otros en el espacio al enfatizar la estética pictórica en las imágenes que produce. La plataforma no está tratando de crear imágenes fotorrealistas que puedan confundirse con fotografías, y el CEO David Holz dice que personalmente está muy incómodo con la extraña calidad de las falsificaciones profundas y otros trabajos que simulan la realidad demasiado de cerca. En cambio, Holz dice que Midjourney está diseñado para desbloquear la creatividad de la gente común al brindarles herramientas para hacer bellas imágenes con solo describirlas.

Pero a pesar del enfoque humanista y orientado al consumidor de la empresa, existen preguntas inevitables sobre las implicaciones para el arte comercial y los artistas profesionales. Entrevisté a Holz para un pieza más amplia sobre las posibles interrupciones que el arte de la IA probablemente cause en la producción de imágenes para el entretenimiento, los videojuegos y la publicación. Aquí hay un extracto más largo de nuestra conversación donde Holz brinda más profundidad y contexto al abordar esos problemas y expone su visión de la empresa, la industria y la tecnología. La entrevista ha sido editada por su extensión y claridad.

Rob Salkowitz, colaborador de Forbes: ¿Cuál es su función y título?

David Holz, Medio viaje. Soy el fundador y CEO. Sin embargo, por lo general prefiero que me llamen fundador, porque CEO suena muy comercial y nosotros no somos muy comerciales. Somos un laboratorio de investigación aplicada que fabrica productos.

¿Cuál es la misión de Midjourney?

Nos gusta decir que estamos tratando de expandir los poderes imaginativos de la especie humana. El objetivo es hacer que los humanos sean más imaginativos, no hacer máquinas imaginativas, lo que creo que es una distinción importante.

¿Puede dar una breve historia de la empresa hasta la fecha?

Empezamos a trabajar en la parte de la imaginación de nuestra empresa hace aproximadamente un año y medio. Hubo algunos avances en los modelos de difusión, la gente entendió clip, openAI, ese tipo de cosas. Casi todos los involucrados en esto son San Francisco y todos nos dimos cuenta de que esto se pondrá serio, que es diferente de muchas otras cosas.

¿Cuál considera Midjourney como el beneficio de esta tecnología de texto a imagen para las empresas y la sociedad?

Definitivamente estoy más preocupado por la sociedad que por los negocios. Somos un producto de consumo, pero tal vez entre el 30 % y el 50 % de nuestros usuarios en este momento son profesionales. La mayoría no lo son. Los artistas de la plataforma nos dicen que les permite ser más creativos y exploradores al principio, generando muchas ideas en poco tiempo.

En este momento, nuestros usuarios profesionales están utilizando la plataforma para la concepción. La parte más difícil de [un proyecto de arte comercial] es a menudo al principio, cuando la parte interesada no sabe lo que quiere y tiene que ver algunas ideas para reaccionar. Midjourney puede ayudar a las personas a converger en la idea que desean mucho más rápidamente, porque la iteración de esos conceptos es muy laboriosa.

Otra ventaja para los artistas es que les da confianza a las personas en áreas en las que no confían. La mayoría, si no todos los artistas, sienten que hay una parte del arte que no pueden hacer bien. Pueden ser colores, composición, fondos. Tenemos un diseñador de personajes famoso que usa nuestro producto y la gente le pregunta por qué usarías una IA si ya eres tan bueno. Y él dijo, “bueno, solo soy bueno en la parte del personaje. Esto me está ayudando con el resto, el mundo, el fondo, los esquemas de color”.

¿Cuántas personas están utilizando el producto?

Millones lo están usando. Nuestro Discord supera los dos millones. Es el servidor de Discord activo más grande con diferencia ahora.

¿La licencia de Midjourney permite el uso comercial de las imágenes generadas por la plataforma?

Sí. Pero si trabaja para una empresa con ingresos anuales superiores a un millón de dólares, le pedimos que compre una licencia corporativa.

¿Cómo se construyó el conjunto de datos?

Es solo un gran rasguño de Internet. Usamos los conjuntos de datos abiertos que se publican y entrenamos a través de ellos. Y yo diría que eso es algo que hace el 100% de la gente. No éramos exigentes. La ciencia realmente está evolucionando rápidamente en términos de la cantidad de datos que realmente necesita, en comparación con la calidad del modelo. Tomará algunos años resolver realmente las cosas, y para ese momento, es posible que tenga modelos que entrene con casi nada. Nadie sabe realmente lo que puede hacer.

¿Buscó el consentimiento de artistas vivos o trabajo todavía bajo derechos de autor?

No. Realmente no hay forma de obtener cien millones de imágenes y saber de dónde provienen. Sería genial si las imágenes tuvieran metadatos incrustados sobre el propietario de los derechos de autor o algo así. Pero eso no es una cosa; no hay un registro. No hay forma de encontrar una imagen en Internet y luego rastrearla automáticamente hasta un propietario y luego tener alguna forma de hacer algo para autenticarla.

¿Pueden los artistas optar por no ser incluidos en su modelo de entrenamiento de datos?

Estamos viendo eso. El desafío ahora es descubrir cuáles son las reglas y cómo averiguar si una persona es realmente el artista de una obra en particular o simplemente pone su nombre en ella. No hemos encontrado a nadie que quiera que se elimine su nombre del conjunto de datos.

¿Pueden los artistas optar por no ser nombrados en las indicaciones?

No ahora. Estamos viendo eso. Nuevamente, tendríamos que encontrar una manera de autenticar esas solicitudes, lo que puede complicarse.

¿Qué les dices a los artistas comerciales preocupados de que esto destruya su sustento? En cierto punto, ¿por qué un director de arte contrataría a un ilustrador para producir trabajos como arte conceptual, diseño de producción, fondos, ese tipo de cosas, cuando solo pueden ingresar indicaciones y obtener resultados útiles mucho más rápido y a un costo mucho menor?

Es mucho trabajo todavía. No es solo como "hazme un fondo". Puede que sea diez veces menos trabajo, pero es mucho más trabajo del que va a hacer un gerente.

Creo que hay dos formas en que esto podría ir. Una forma es tratar de proporcionar el mismo nivel de contenido que la gente consume a un precio más bajo, ¿no? Y la otra forma de hacerlo es crear contenido mucho mejor a los precios que ya estamos dispuestos a gastar. Encuentro que la mayoría de las personas, si ya están gastando dinero, y tienes la opción entre contenido mucho mejor o contenido más barato, en realidad eligen contenido mucho mejor. El mercado ya ha establecido un precio que la gente está dispuesta a pagar.

Creo que algunas personas intentarán eliminar a los artistas. Intentarán hacer algo similar a menor costo, y creo que fracasarán en el mercado. Creo que el mercado irá hacia una mayor calidad, más creatividad y un contenido mucho más sofisticado, diverso y profundo. Y las personas que realmente son capaces de usar como los artistas y usan las herramientas para hacerlo son las que van a ganar.

Estas tecnologías en realidad crean una apreciación y alfabetización mucho más profundas en el medio visual. Es posible que realmente tengas la demanda, superes la capacidad de producir a ese nivel, y luego tal vez aumentes los salarios de los artistas. Puede ser raro, pero eso es lo que va a pasar. El ritmo de ese aumento de la demanda tanto de calidad como de diversidad conducirá a la realización de algunos proyectos maravillosos e inesperados.

Una generación de estudiantes se graduó en escuelas de arte, muchos de ellos muy endeudados, contando con trabajos relativamente bien pagados en producción de entretenimiento, producción de videojuegos, arte comercial, etc. ¿Cómo impacta en su futuro la aparición de plataformas de texto a imagen de IA?

Creo que algunas personas intentarán reducir costos y otras intentarán ampliar sus ambiciones. Creo que las personas que amplían sus ambiciones seguirán pagando los mismos salarios, y creo que las personas que intentan reducir costos fracasarán.

Por lo general, Ai se usa a escala para cosas como centros de llamadas o control de maletas en aeropuertos y el tipo de trabajos que a las personas realmente no les interesa hacer. Y la propuesta de valor es que libera a las personas para hacer trabajos más gratificantes e interesantes. Pero los trabajos de arte son gratificantes e interesantes. Las personas trabajan toda su vida y desarrollan sus habilidades para conseguir este tipo de trabajos. ¿Por qué señalaría esta tecnología a ese nivel de la economía como una especie de enfoque comercial y prioridad para las cosas que está haciendo?

Personalmente, no lo soy. Mi material no está hecho para artistas profesionales. Si les gusta usarlo, entonces eso es genial. Mis cosas están hechas para personas que, como, hay una mujer en Hong Kong, ella vino a mí y me dice: "Lo único en Hong Kong que tus padres nunca quieren que seas es un artista, y yo". Ahora soy banquero. Estoy viviendo una buena vida de banquero. Pero con Midjourney ahora estoy empezando a probar esta experiencia de ser la persona que realmente quería ser”. O un tipo en la parada de camiones que está haciendo sus propias tarjetas de béisbol con imágenes salvajes, solo por diversión. Está hecho para esas personas porque, como la mayoría de las personas, nunca pueden hacer estas cosas.

Es importante recalcar que no se trata de arte. Esto se trata de imaginación. La imaginación se usa a veces para el arte, pero a menudo no. La mayoría de las imágenes creadas en Midjourney no se utilizan profesionalmente. Ni siquiera se comparten. Simplemente están siendo utilizados para estos otros propósitos, estas necesidades muy humanas.

No obstante, el resultado de su producto son imágenes, que tienen valor comercial en un contexto profesional además de todas esas otras propiedades. Y esto es muy perjudicial para esa economía.

Creo que es como si estuviéramos haciendo un bote, y alguien puede competir con el bote, pero eso no significa que el bote se trate de carreras. Si usas el barco para competir, entonces tal vez sí, seguro. en ese momento es. Pero el lado humano realmente importa, y creo que no estamos... Queremos hacer que las imágenes se vean bonitas. No nos vemos tratando de crear arte como parte de lo nuestro. Queremos que el mundo sea más imaginativo. Preferimos hacer cosas hermosas que cosas feas.

¿Cree que algún organismo gubernamental tiene jurisdicción o autoridad para regular esta tecnología? Y si es así, ¿crees que deberían hacerlo?

No sé. La regulación es interesante. Tienes que equilibrar la libertad de hacer algo con la libertad de estar protegido. La tecnología en sí no es el problema. es como el agua El agua puede ser peligrosa, puedes ahogarte en ella. Pero también es esencial. No queremos prohibir el agua solo para evitar las partes peligrosas.

Bueno, queremos asegurarnos de que nuestra agua esté limpia.

Sí, eso es verdad.

Fuente: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- economía-creativa/