DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Φωτογραφία, ζωγραφική, γλυπτική, ψηφιδωτά, κ.ά.
Άβαταρ μέλους
hellegennes
Δημοσιεύσεις: 40357
Εγγραφή: 01 Απρ 2018, 00:17

DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από hellegennes » 23 Δεκ 2022, 23:28

Επειδή είχαμε μια μακριά συζήτηση σε κάποιο άλλο σημείο του φόρουμ και σε άλλο νήμα για το τι ακριβώς κάνει η εφαρμογή DALL-E, που υποτίθεται ότι δημιουργεί on the spot καινούργιες εικόνες με τρομερή πίστη στην περιγραφή που τις δίνεις (σε κείμενο), αποφάσισα να την δοκιμάσω. Αυτά είναι τα αποτελέσματα. Σε εισαγωγικά είναι η περιγραφή που έδωσα για να πάρω το κάθε αποτέλεσμα.


Για αρχή, είναι εξαιρετικά καλή στο να δημιουργεί πράγματα που είναι πολύ ξεκάθαρα δοσμένα, όπως αυτό το "lonely huge tree in a hill" (υπόψη ότι εν πολλοίς αγνοεί τις προθέσεις, που ήθελα να τεστάρω δίνοντας "in" αντί "on":

Εικόνα


Αρχίζει να δυσκολεύεται όταν η περιγραφή έχει συνδυασμό πραγμάτων που απαιτούν ανάμειξη, όπως εδώ στο "the Greek parliament in flames", με αποτέλεσμα να μοιάζει με κακά γραφικά της δεκαετίας του '80. Δεν υπάρχει ανάμειξη χρωμάτων, καπνοί και τα ατμοσφαιρικά εφέ που θα περίμενε κανείς:

Εικόνα


Της είναι μακράν πιο εύκολο να φτιάχνει ζωγραφιές, όπως αυτό το εδώ το αρκετά πετυχημένο "Alexis Tsipras riding a pony":

Εικόνα


Ή αυτό το "horse telling jokes to the pope". Να σημειώσω εδώ ότι αυτό είναι μόνο ένα από τα 4-5 εναλλακτικά αποτελέσματα που βγάζει. Αυτό ήταν το πιο κοντινό σε άλογο. Οι υπόλοιπες εικόνες ήταν κανονικοί άνθρωποι με περίεργες μύτες.

Εικόνα


Ενώ έχει την δυνατότητα φωτορεαλιστικής απεικόνισης, τα πράγματα είναι τραγικά όταν πρέπει να φιλοτεχνήσει πρόσωπα. Εδώ δύο παραλλαγές στο θέμα "gorgeous man". Απλά τραγικό.

Εικόνα

Εικόνα


Ενδιαφέρον παρουσιάζει πώς αντιλαμβάνεται τελείως ράντομ κόνσεπτ, όπως ονόματα εταιρειών. Εδώ έχουμε "Google kicking Microsoft". Οι παραλλαγές ήταν όλες στυλ κουνγκ φου αλλά με φωτορεαλιστικούς ανθρώπους αντί ζωγραφιές. Αυτή ήταν η πιο διασκεδαστική και πετυχημένη.

Εικόνα


Κάπου εδώ αρχίζει και δείχνει τους περιορισμούς της η εφαρμογή και με ποιον τρόπο ζωγραφίζει. Στην πραγματικότητα αυτό που κάνει είναι ότι έχει πρόσβαση σε μια τεράστια βιβλιοθήκη με εικόνες ακι έχει εκπαιδευτεί να συσχετίζει συγκεκριμένα αντικείμενα με συγκεκριμένες λέξεις. Αυτός είναι ο λόγος που δεν κατάφερα σε καμμιά μου προσπάθεια να βρω μια πετυχημένη εικόνα για το "Japanese building in the middle of the ocean". Όπως φαίνεται σ' αυτήν την εικόνα και σε κάθε εικόνα που μου έδωσε το πρόγραμμα, υπάρχουν στο βάθος βουνά. Μάλιστα προσπάθησα και με "with no mountains" και διάφορες παραλλαγές και πάντα έβγαζε βουνά στο βάθος. Γιατί; Γιατί η ΑΙ έχει εκπαιδευτεί σε εικόνες που πάντα τα παραδοσιακά γιαπωνέζικα κτήρια είχαν στο βάθος βουνά, οπότε συσχέτισε το κόνσεπτ "japanese building" με αυτές τις βασικές γεωμετρικές παραμέτρους που περιλάμβανουν ορεινούς όγκους στο βάθος. Η ΑΙ ήταν μη ικανή να αντιληφθεί ότι αυτό δεν είναι μέρος του κόνσεπτ.

Εικόνα
Ξημέρωσε.
Α, τι ωραία που είναι!
Ήρθε η ώρα να κοιμηθώ.
Κι αν είμαι τυχερός,
θα με ξυπνήσουν μια Δευτέρα παρουσία κατά την θρησκεία.
Μα δεν ξέρω αν και τότε να σηκωθώ θελήσω.

Άβαταρ μέλους
hellegennes
Δημοσιεύσεις: 40357
Εγγραφή: 01 Απρ 2018, 00:17

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από hellegennes » 23 Δεκ 2022, 23:31

Και κάπου εδώ αρχίζει και γαμιέται το σύμπαν. Εδώ έχουμε "a pig eating an elephant". Δεν ξέρω τι ήπιε ο DALL-E πριν το σχεδιάσει, αλλά το αποτέλεσμα είναι τελείως αλλόκοτο.

Εικόνα


Εκεί όμως που αποτυγχάνει οικτρά είναι στην απεικόνιση ατόμων, ειδικά αν είναι πάνω από 1-2. Εδώ έχουμε "fourteen men playing football". Αφενός είναι φανερό ότι δεν παίζουν, ποζάρουν. Αφετέρου δεν είναι 14. Είναι σαν κακό κολάζ με ασχημα κολλημένα περιγράμματα και τα πρόσωπα... τι να πω για τα πρόσωπα;

Εικόνα


Κι εδώ βλέπουμε μια άλλη παραλλαγή του ίδιου θέματος. Εδώ υπάρχει δράση -με τους μη 14 άντρες- αλλά είναι λιγότερο ποδόσφαιρο και περισσότερο "η ανοιξιάτικη μέρα των ζωντανών νεκρών". Αυτό το ημίγυμνο εξάμβλωμα στα πόδια τους δεν έχω καταλάβει ακόμα τι είναι.

Εικόνα
Ξημέρωσε.
Α, τι ωραία που είναι!
Ήρθε η ώρα να κοιμηθώ.
Κι αν είμαι τυχερός,
θα με ξυπνήσουν μια Δευτέρα παρουσία κατά την θρησκεία.
Μα δεν ξέρω αν και τότε να σηκωθώ θελήσω.

Άβαταρ μέλους
GreekGuy
Δημοσιεύσεις: 1052
Εγγραφή: 05 Νοέμ 2022, 19:52
Phorum.gr user: greekguy
Τοποθεσία: Θεσσαλονίκη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από GreekGuy » 23 Δεκ 2022, 23:33

πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια :smt005:
Όλα γίνονται για κάποιον λόγο, ακόμα και αν δε γνωρίζεις τον λόγο.

Άβαταρ μέλους
hellegennes
Δημοσιεύσεις: 40357
Εγγραφή: 01 Απρ 2018, 00:17

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από hellegennes » 23 Δεκ 2022, 23:38

GreekGuy έγραψε:
23 Δεκ 2022, 23:33
πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια :smt005:
Το δοκίμασα και μου έβγαζε πιάτα από φαγητά. Έτσι, στο ράντομ. Να δύο:


Εικόνα

Εικόνα
Ξημέρωσε.
Α, τι ωραία που είναι!
Ήρθε η ώρα να κοιμηθώ.
Κι αν είμαι τυχερός,
θα με ξυπνήσουν μια Δευτέρα παρουσία κατά την θρησκεία.
Μα δεν ξέρω αν και τότε να σηκωθώ θελήσω.

Άβαταρ μέλους
GreekGuy
Δημοσιεύσεις: 1052
Εγγραφή: 05 Νοέμ 2022, 19:52
Phorum.gr user: greekguy
Τοποθεσία: Θεσσαλονίκη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από GreekGuy » 23 Δεκ 2022, 23:44

hellegennes έγραψε:
23 Δεκ 2022, 23:38
GreekGuy έγραψε:
23 Δεκ 2022, 23:33
πες της να σχεδιάσει τον εαυτό της, απλά από περιέργεια :smt005:
Το δοκίμασα και μου έβγαζε πιάτα από φαγητά. Έτσι, στο ράντομ. Να δύο:


Εικόνα

Εικόνα
Σαν να σου λέει "είμαι καλοφαγού" :003::003:
Όλα γίνονται για κάποιον λόγο, ακόμα και αν δε γνωρίζεις τον λόγο.

Άβαταρ μέλους
GreekGuy
Δημοσιεύσεις: 1052
Εγγραφή: 05 Νοέμ 2022, 19:52
Phorum.gr user: greekguy
Τοποθεσία: Θεσσαλονίκη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από GreekGuy » 24 Δεκ 2022, 00:02

Πες της να ζωγραφίσει τον Θεό
Όλα γίνονται για κάποιον λόγο, ακόμα και αν δε γνωρίζεις τον λόγο.

Άβαταρ μέλους
Καραμελίτσα
Δημοσιεύσεις: 8648
Εγγραφή: 17 Σεπ 2020, 17:35

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από Καραμελίτσα » 24 Δεκ 2022, 00:18

Πλάκα έχει. Με τα ανθρώπινα πρόσωπα όντως δεν το έχει.

Two men and two women on a boat


Εικόνα


An oil painting of a goat, a man and a dog


Εικόνα


A Greek vase painting of computers


Εικόνα
Z

Imperium
Δημοσιεύσεις: 3421
Εγγραφή: 23 Απρ 2020, 12:47

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από Imperium » 24 Δεκ 2022, 00:30

Το chatGTP - "Εικαστικές Τέχνες Edition".

Το μόνο καλό, έτσι χύμα που βγαίνουν τελευταία όλα αυτά τα προγράμματα, θα τα βαρεθεί πιο σύντομα ο κόσμος.
Ποτέ μην εμπιστεύεσαι επιστήμονα που φοβάται να πετάξει με αεροπλάνο.

Άβαταρ μέλους
GreekGuy
Δημοσιεύσεις: 1052
Εγγραφή: 05 Νοέμ 2022, 19:52
Phorum.gr user: greekguy
Τοποθεσία: Θεσσαλονίκη

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από GreekGuy » 24 Δεκ 2022, 00:39

Καραμελίτσα έγραψε:
24 Δεκ 2022, 00:18
Πλάκα έχει. Με τα ανθρώπινα πρόσωπα όντως δεν το έχει.

Two men and two women on a boat


Εικόνα


An oil painting of a goat, a man and a dog


Εικόνα


A Greek vase painting of computers


Εικόνα
Μπέσα, άμα είχα κονέ κανά σκηνοθέτη ταινιών τρόμου τύπου jumpscares /mockumentary (Paranormal Activity φάση) , θα του πρότεινα να χρησιμοποιήσει το πρόγραμμα για τα πρόσωπα των κακών, θα γλύτωνε τόσα λεφτά από το CGI.
Όλα γίνονται για κάποιον λόγο, ακόμα και αν δε γνωρίζεις τον λόγο.

Άβαταρ μέλους
AlienWay
Δημοσιεύσεις: 22707
Εγγραφή: 08 Οκτ 2019, 13:15
Phorum.gr user: AlienWay

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από AlienWay » 24 Δεκ 2022, 00:42

Σαφώς καλύτερα αποτελέσματα δίνει το Hotpot. ΟΜΩΣ δεν είναι δωρεάν. Οι πρώτες δέκα εικόνες (ή κάπου τόσο) που θα φτιάξετε είναι δωρεάν μόνο. Εκεί γίνεται να επιλέξει κανείς και τεχνοτροπίες.

Παραδείγματα από εικόνες που το έχω βάλει να κάνει.


Εικόνα



Εικόνα

Στα πρόσωπα όμως, υπερέχει ξεκάθαρα. Του παραγγέλνω πορτραίτα για RPG



Εικόνα



Εικόνα


Εικόνα
Ζούμε σε μια οικονομία.

Άβαταρ μέλους
hellegennes
Δημοσιεύσεις: 40357
Εγγραφή: 01 Απρ 2018, 00:17

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από hellegennes » 24 Δεκ 2022, 01:20

Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).
Ξημέρωσε.
Α, τι ωραία που είναι!
Ήρθε η ώρα να κοιμηθώ.
Κι αν είμαι τυχερός,
θα με ξυπνήσουν μια Δευτέρα παρουσία κατά την θρησκεία.
Μα δεν ξέρω αν και τότε να σηκωθώ θελήσω.

Άβαταρ μέλους
Awesomatic
Δημοσιεύσεις: 6511
Εγγραφή: 16 Μάιος 2018, 00:11
Phorum.gr user: Awesomatic

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από Awesomatic » 24 Δεκ 2022, 01:37

Το DALL-E επίτηδες δεν έχει εκπαιδευτεί να δίνει προσοχή σε πρόσωπα γι αυτό το αποτέλεσμα είναι συνήθως έτσι (και δεν το αδικώ γιατί μετά θα έβγαιναν οι κλασικοί ψεκ και θα άρχιζαν τις θεωρίες συνωμοσίας). Αντίθετα οι άνθρωποι δίνουν εκεί την μεγαλύτερη προσοχή όταν τα παρατηρούν σε σημείο που προσέχουμε ασυνείδητα τρελά μικροσκοπικές λεπτομέρειες. Ένας από τους λόγους που παρά την μεγάλη πρόοδο στα γραφικά είναι ακόμα όχι δύσκολο να ξεχωρίσεις φωτογραφία από 3d rendered scene είναι και αυτός.

Υπάρχουν και μερικές άλλες καλές όπως το Hotpot που πρότεινε ο AlienWay για πιο εξειδικευμένα πράγματα.
"Taxation is theft, purely and simply even though it is theft on a grand and colossal scale which no acknowledged criminals could hope to match. It is a compulsory seizure of the property of the State’s inhabitants, or subjects."

Άβαταρ μέλους
AlienWay
Δημοσιεύσεις: 22707
Εγγραφή: 08 Οκτ 2019, 13:15
Phorum.gr user: AlienWay

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από AlienWay » 24 Δεκ 2022, 10:31

hellegennes έγραψε:
24 Δεκ 2022, 01:20
Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).
1ον: Σε όλες τις εφαρμογές τεχνητής νοημοσύνης, αξιοποιούνται ήδη υπάρχουσες εικόνες οι οποίες παραλλάσσονται. Άρα δεν ισχύει μόνο στη ζωγραφική που κάνουν, ισχύει σε όλα.
2ον: Αν στο hotpot βάλεις μια φωτο σου, διαλέξεις την τεχνοτροπία Game 1 (δηλαδή να φτιάξει πορτρέτο για game) και δώσεις μια παράμετρο π.χ. human barbarian, θα διαπιστώσεις ότι το αποτέλεσμα που θα λάβεις, δεν θα βασίζεται 100% στη φωτο που έδωσες (υπάρχει μάλιστα η πιθανότητα να μη σου μοιάζει). Αυτό συμβαίνει γιατί αυτές οι εφαρμογές συγχωνεύουν δεδομένα από πολλές εικόνες ώστε να δώσουν τη ζητούμενη εικόνα, με αποτέλεσμα τα όρια του κλόπυραιτ να γίνονται ρευστά.

Ο "μάγος" που έβαλα παραπάνω (human wizard ήταν η παράμετρος που έδωσα) βασίζεται εν μέρει σε φωτογραφία μιας δημοφιλούς περσόνας.
Ζούμε σε μια οικονομία.

Άβαταρ μέλους
ST48410
Δημοσιεύσεις: 24347
Εγγραφή: 31 Μαρ 2018, 20:21

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από ST48410 » 26 Δεκ 2022, 01:55

Awesomatic έγραψε:
24 Δεκ 2022, 01:37
Το DALL-E επίτηδες δεν έχει εκπαιδευτεί να δίνει προσοχή σε πρόσωπα γι αυτό το αποτέλεσμα είναι συνήθως έτσι (και δεν το αδικώ γιατί μετά θα έβγαιναν οι κλασικοί ψεκ και θα άρχιζαν τις θεωρίες συνωμοσίας). Αντίθετα οι άνθρωποι δίνουν εκεί την μεγαλύτερη προσοχή όταν τα παρατηρούν σε σημείο που προσέχουμε ασυνείδητα τρελά μικροσκοπικές λεπτομέρειες. Ένας από τους λόγους που παρά την μεγάλη πρόοδο στα γραφικά είναι ακόμα όχι δύσκολο να ξεχωρίσεις φωτογραφία από 3d rendered scene είναι και αυτός.
Πειραματίστηκα λίγο στην σελίδα του stablediffusionweb.com και ενώ το πρόβλημα στα πρόσωπα (ανθρώπων και ζώων) είναι σοβαρό και το αποτέλεσμα αποκρουστικό, δεν εστιάζεται αποκλειστικά εκεί. Θα περίμενες να καταλαβαίνει ότι ένα ζώο δεν μπορεί να έχει πολλές ουρές ή περισσότερα πόδια από το κανονικό, αλλά δεν ξέρω πως ακριβώς εκπαιδεύεται οπότε ίσως έχω υπερβολικές απαιτήσεις.

Γενικώς τα αποτελέσματα δεν ήταν ικανοποιητικά.

Άβαταρ μέλους
ST48410
Δημοσιεύσεις: 24347
Εγγραφή: 31 Μαρ 2018, 20:21

Re: DALL-E ή πώς ζωγραφίζει μια τεχνητή νοημοσύνη

Μη αναγνωσμένη δημοσίευση από ST48410 » 26 Δεκ 2022, 01:59

hellegennes έγραψε:
24 Δεκ 2022, 01:20
Σε ζωγραφιές και η DALL-E δίνει καλά αποτελέσματα. Μάντεψε όμως γιατί συμβαίνει αυτό (hint: κλόπιραϊτ).
Δεν είμαι σίγουρος ότι κατάλαβα τι εννοείς. Αν δεν βαριέσαι, πες.

Απάντηση


  • Παραπλήσια Θέματα
    Απαντήσεις
    Προβολές
    Τελευταία δημοσίευση

Επιστροφή στο “Eικαστικές τέχνες”

Phorum.com.gr : Αποποίηση Ευθυνών