Generator seni AI memiliki rap yang buruk untuk menghasilkan penggambaran tangan yang tidak akurat. Mari mengadu Midjourney v5 melawan Dall-E 2 untuk melihat mana yang lebih baik.
Generator seni AI terus mengesankan, memungkinkan kami membuat apa saja yang dapat kami bayangkan. Namun, teknologi tersebut tampaknya telah membentur dinding bata ketika harus menghasilkan tangan yang tampak realistis.
Di sini, kami melihat dua aplikasi seni generatif terkemuka dan membandingkannya secara langsung—atau dari tangan ke tangan—untuk melihat mana yang dapat menghasilkan tangan yang lebih baik, Midjourney v5 atau Dall-E 2. Apakah salah satu dari aplikasi ini menguasai tangan? Ayo cari tahu!
Masalah AI Dengan Tangan
Sejak seni yang dihasilkan AI tersebar luas di internet, ada kritik terkait kualitas tangan yang digambar oleh AI. Meskipun pembaruan terkini, seperti yang ditunjukkan dalam perbandingan berdampingan kami, hasilnya belum memuaskan.
Kedua pesaing telah meningkatkan kemampuan dan kualitas hasil mereka dengan setiap iterasi. Pembaruan terbaru,
Versi 5 dari Midjourney, telah menunjukkan kemajuan yang mengesankan. Namun, masalah tangan yang ditarik oleh AI masih belum terselesaikan dan tidak dapat diabaikan.Perbandingan 1: Menggunakan Prompt "Hand" dan "Hands"
Perbandingan kami akan berisi petunjuk yang sama persis untuk Dall-E 2 dan Midjourney v5. Kami akan merancang petunjuknya agar sesuai dengan tangan, bukan sekadar membuat orang untuk melihat tampilan tangan. Kami juga memberikan setiap aplikasi hanya satu kesempatan (putaran) untuk setiap permintaan.
Tangan
Mari kita mulai dengan perintah yang paling dasar dan relevan: "tangan".
Pertengahan perjalanan v5:
Dall-E 2:
Kami tidak memulai dengan baik!
Midjourney mengambil rute yang tidak biasa dengan mengasosiasikan tangan dengan situasi yang agak kreatif. Alih-alih berfokus hanya pada satu tangan, kami melihat seorang penyihir, sarung tangan, kerangka, dan patung kecil. Gambar sarung tangan juga kehilangan satu jari.
Dall-E 2 mengambil pendekatan yang berlawanan dan hanya menawarkan satu tangan dengan latar belakang yang sederhana. Namun anehnya, ada beberapa postur aneh, terutama dengan ibu jari, yang terlihat tidak alami atau nyaman. Setiap tangan juga terpotong di salah satu sisi gambar.
Siapa yang memenangkan babak ini? Kami akan memberikannya kepada Dall-E 2 untuk akurasi keseluruhan.
Tangan
Sekarang, mari buat jamak prompt, "tangan", dan lihat apa yang dihasilkan oleh AI.
Pertengahan perjalanan v5:
Dall-E 2:
Upaya Midjourney pada "tangan" ternyata lebih baik kali ini. Tapi keempat gambar itu hitam putih, dan ada beberapa jari yang hilang. Setelah diamati lebih dekat, Anda juga dapat melihat bahwa beberapa digit berbentuk aneh atau berubah menjadi satu sama lain.
Dall-E 2 terus menampilkan tangan dengan latar belakang polos. Tidak ada angka yang hilang, tetapi tangan terpotong pada gambar ketiga dan versi lainnya tampak agak canggung dalam komposisi dan sama sekali tidak memiliki kreativitas.
Mari kita sebut perbandingan ini seri. Dall-E 2 akan menang untuk akurasi jika itu satu-satunya faktor, tetapi Midjourney berhasil membuatnya citra yang indah dalam terjemahan hitam-putihnya, meskipun keempat versinya tidak terlalu bagus realistis.
Kamu selalu bisa gunakan Photoshop untuk memperbaiki seni Midjouney Anda, termasuk tangan.
Perbandingan 2: Gerakan Tangan
Mari kita bandingkan beberapa gestur tangan yang hampir dikenal secara universal.
Semoga saja
Pertama, mari kita coba "semoga saja".
Pertengahan perjalanan v5:
Dall-E 2:
Aman untuk mengatakan bahwa Midjourney benar-benar merusak prompt ini. Kami kehilangan jari dan tidak ada versi yang terlihat alami sama sekali.
Angkat topi sekali lagi untuk Dall-E 2 karena menghitung jari dengan benar, tetapi itu satu-satunya kabar baik. Setiap versi terlihat seperti jari-jari melakukan pose yoga mereka sendiri dalam permainan Twister.
Tidak ada pemenang dalam perbandingan ini.
Jempolan
Selanjutnya, kita pergi dengan "jempol".
Pertengahan perjalanan v5:
Dall-E 2:
Midjourney mendapatkan hitungan jari dengan benar sambil memperlakukan setiap prompt dengan cara yang kreatif. Perhatikan pengenalan gaya ilustratif?
Dall-E 2 juga mendapat poin untuk akurasi sambil tidak mencoba mengguncang perahu dengan menambahkan kreatif apa pun ke setiap hasil.
Tidak ada pemenang yang jelas di sini.
Perbandingan 3: Tangan Dengan Benda
Sekarang, kita tingkatkan kerumitannya dengan mendorong tangan untuk berinteraksi dengan objek.
Tangan Memegang Bola Kristal
Mari kita mulai dengan objek acak, menggunakan prompt "tangan memegang bola kristal".
Pertengahan perjalanan v5:
Dall-E 2:
Saat kami meningkatkan kerumitannya, Midjourney mulai bersinar. Terlepas dari beberapa penampakan yang terlihat tidak wajar, tangan dan bola kristal terlihat indah. Midjourney bahkan membutuhkan waktu untuk menciptakan pantulan di kaca yang tentunya menambah kreativitas secara keseluruhan.
Tetapi untuk pertama kalinya, kami melihat Dall-E 2 kehilangan satu digit di setidaknya satu tangan, dengan tangan keempat tampak sangat aneh. Bola kristal juga tidak terlihat mengesankan dibandingkan dengan Midjourney.
Midjourney mendapatkan kemenangan pertamanya.
Tangan Memegang Air
Mari kita coba sesuatu yang lebih kompleks dengan prompt "tangan memegang air".
Pertengahan perjalanan v5:
Dall-E 2:
Midjourney hanya berhasil menggulung satu gambar dengan jumlah digit yang benar. Meskipun ditampilkan dengan indah, sekali lagi kita mulai melihat celah di departemen kepercayaan.
Dall-E 2 berjuang untuk mencapai tangan alami juga, tetapi melakukan pekerjaan yang jauh lebih baik. Ini mengubah warna di latar belakang juga untuk beberapa variasi.
Kami akan memberikan putaran ini ke Dall-E 2.
Perbandingan 4: Tangan Kerja
Untuk perbandingan ini, kami akan membuat petunjuk yang melibatkan tangan dalam aktivitas.
Tangan Moulding Tanah Liat
Mari kita lihat bagaimana model AI bekerja dengan "tanah liat cetakan tangan".
Pertengahan perjalanan v5:
Dall-E 2:
Midjourney melewatkan satu jari dalam dua gambar tetapi yang lainnya tampak hebat.
Gambar Dall-E 2 terlihat membingungkan dan penuh sesak, terpaksa menambahkan tangan orang lain di setengah versinya.
Tepi pergi ke Midjourney.
Tangan Menekan Adonan
Mari kita coba kegiatan serupa, "mengepres adonan dengan tangan".
Pertengahan perjalanan v5:
Dall-E 2:
Gambar Midjourney terlihat bagus secara keseluruhan. Tapi sekali lagi, setengah dari mereka memiliki angka yang hilang. Tapi gambarnya tidak bisa disalahkan karena gaya artistiknya.
Versi Dall-E 2 kehilangan jari juga di setengah dari rendisi dan bahkan menambahkan satu ke tangan terakhir di set.
Sebut saja ini undian.
Jika Anda ingin mencoba sendiri perbandingan ini, kami tunjukkan cara menggunakan Midjourney untuk membuat seni AI.
Apa Hasil Memberitahu Kami?
Sangat menyenangkan untuk melakukan perbandingan dan menentukan pemenang keseluruhan. Dan jika kami harus memilih, kami akan memilih Midjourney v5. Meskipun Dall-E 2 lebih sering membuat tangan dengan jumlah jari yang tepat, Midjourney-lah yang membuat gambar yang lebih artistik dan menarik.
Namun kedua aplikasi memiliki tempat di pasar bagi seniman yang menggunakan kembali gambar Dall-E 2 dan Midjourney untuk pekerjaan mereka. Keduanya mampu menciptakan tangan yang dapat digunakan sebagai guntingan atau komposit untuk penggunaan artistik, editorial, dan komersial. Ini hanya masalah preferensi pribadi.
AI Akhirnya Akan Menaklukkan Tangan
Aplikasi seni generatif seperti Dall-E 2 dan Midjourney telah berkembang pesat dalam kemampuan mereka untuk menciptakan seni yang realistis dan fantastis. Mereka masih kesulitan menghasilkan tangan, tetapi mengingat percepatan teknologi generatif, kami hanya dapat mengharapkan peningkatan dalam waktu dekat.