Γράφαμε σε προηγούμενο σημείωμά μας για την αχίλλειο πτέρνα των image generators. Δηλ. την καταφανή αδυναμία τους να αναπαραστήσουν σωστά τα δάκτυλα των ανθρώπων όπως άλλωστε έχει αποδειχθεί μέσα από πολλά παραδείγματα.
Όμως τώρα κάτι αλλάζει. Η έκδοση V5 του Midjourney, που μαζί με το Dall-E είναι το πιο γνωστό AI image generator, φαίνεται ότι καταφέρνει να απαλείψει το πρόβλημα. Προς παρόν βέβαια η έκδοση V5 είναι διαθέσιμη μόνο σε συνδρομητές και από την εμπειρία τους και σχετικές αναφορές φαίνεται ότι πηγαίνει εξαιρετικά καλά στη ρεαλιστική αναπαραγωγή των άνω άκρων ενώ πολύ βελτιωμένη είναι και η απόδοση φωτογραφικού ύφους ώστε τα σύνορα ανάμεσα σε πραγματική και ρομποτική φωτογραφία text to image να καταλήγουν πιο συγκεχυμένα παρά ποτέ. Ο μόνος περιορισμός είναι ότι πλέον απαιτείται σαφέστερη και πληρέστερη οδηγία προς το πρόγραμμα μέσω περιγραφής φυσικής γλώσσας ώστε να επιτυγχάνεται το καλύτερο αποτέλεσμα.
To image generator Midjourney V5 επιτέλους αναπαράγει σωστά τα ανθρώπινα χέρια
