AI dapat menipu kita untuk salah mengira seni yang dihasilkan sebagai foto asli. Jadi mengapa tangan merupakan tantangan besar?
Generator AI berevolusi di depan mata kita dengan kecepatan yang menakutkan, tetapi masih memiliki kekurangan. Melihat detail aneh dalam gambar AI sebenarnya cukup lucu. Itu sebabnya tangan Midjourney menjadi topik hangat, masalah umum di banyak mesin.
Mari kita uraikan mengapa tangan sangat menantang pembuat gambar AI. Pemrogram mereka sudah memperbaiki masalah yang layak meme ini, tetapi menarik untuk memikirkan tentang bagaimana kecerdasan buatan belajar, belum lagi apa yang menghalanginya.
Mengapa Tangan yang Dihasilkan AI Membuat Kehebohan
Siapa pun yang menggunakan mesin AI untuk membuat gambar mungkin telah memperhatikan bahwa tangan jarang keluar dengan benar, tetapi masalahnya berubah ketika banyak "foto" muncul di Twitter.
Jika diamati lebih dekat, tangan aneh orang-orang itu memberikannya sebagai gambar yang dihasilkan AI. Fakta bahwa ini adalah upaya Midjourney membuat situasinya lebih menarik.
Salah satu mesin AI terbaik tidak dapat mengatasi kerumitan tangan manusia, sehingga kemampuan Midjourney dan para pesaingnya diuji. Cukup benar, bahkan DALL-E rentan terhadap jari dan kuku yang tidak realistis.
Kegembiraan itu di luar proporsi, mengingat tangan yang dihasilkan AI selalu menjadi masalah, tetapi perhatian ekstra itu mendorong dirilisnya Midjourney v5 untuk meningkatkan v4.
Versi baru membuat desain tangan yang disempurnakan, indikasi yang jelas bahwa para insinyur AI memperhatikan kehebohan yang lucu dan memutuskan untuk meningkatkan kemampuan perangkat lunak.
Mesin lain lambat mengikuti contoh Midjourney, jadi memperbaiki seni AI dengan Photoshop tetap merupakan keterampilan yang tak ternilai. Rintangan utama bagi pemrogram adalah betapa rumitnya melatih kecerdasan buatan untuk menarik tangan yang meyakinkan.
Mengapa Pembuat Gambar AI Berjuang Dengan Tangan?
Mesin AI menggunakan jaringan permusuhan generatif (GAN) atau Difusi Stabil untuk menghasilkan gambar. Kedua teknologi tersebut membutuhkan bahan sumber yang luas, pelatihan, dan kekuatan pemrosesan untuk menciptakan karya seni yang paling dasar sekalipun.
Karena gambar yang sudah ada sebelumnya adalah inti dari pelatihan AI, pemrogram harus memberi makan perangkat lunak mereka ribuan, bahkan jutaan, gambar di samping petunjuk—mengulangi proses berulang-ulang sampai mesin memahami apa yang dimaksud dengan kata tertentu dan bagaimana merepresentasikannya obyek.
Tetapi gambar sumber yang dipelajari AI sebagian besar adalah 2D, di mana tangan digambarkan dalam berbagai posisi. Apakah lurus atau melengkung, menunjukkan lima atau tiga jari.
Pada akhirnya, sebuah mesin tidak benar-benar memahami konsep tangan, dan gambar yang dipelajarinya tidak selalu menampilkan tangan dengan jelas atau cukup konsisten. Itu sebabnya tangan Midjourney bisa sangat jelek: kebingungan AI.
Sahih seperti Kekhawatiran Elon Musk tentang pengembangan AI mungkin, beberapa bagian dari teknologi masih harus banyak belajar. Dan hambatan mereka melampaui contoh tangan yang tidak mencukupi.
Alasan Lain Mengapa Generator Gambar AI Lambat untuk Ditingkatkan
Melihat ke Model Midjourney, v5 menawarkan koherensi tingkat lanjut antara perintah teks dan gambar yang dihasilkan, serta resolusi yang lebih tinggi dan alat tambahan. Tapi prestasi seperti itu tidak murah.
Melatih AI untuk bekerja lebih baik dengan tangan membutuhkan pemberian gambar yang lebih baik, terutama dalam 3D. Itu berarti banyak waktu dan tenaga dihabiskan untuk proses, mulai dari memperoleh materi sumber hingga meningkatkan pengkodean dan mengulangi pelatihan hingga AI melakukannya dengan benar.
Meski begitu, perangkat lunak dapat membuat kesalahan dalam karya seni yang menakjubkan. Selain menjadi pekerjaan yang besar dan kompleks, itu mahal. Jadi, jangan berharap generator teks-ke-gambar AI gratis untuk melangkah ke kaliber Midjourney dulu.
Sederhananya, masalah dengan mesin AI bukan hanya tentang ketidakmampuan program komputer ini untuk sepenuhnya memahami bagaimana fitur manusia seperti tangan dan kaki terlihat atau bekerja. Itu juga tergantung pada biayanya, dan akses teknologi ke citra 3D dan teknik pembelajaran mesin yang dapat membantu generator mendapatkan pemahaman yang lebih realistis tentang dunia di sekitar mereka.
Generator Gambar AI Tidak Akan Berjuang Selamanya
Tangan adalah konsep yang rumit untuk kecerdasan buatan untuk membungkus kepala binernya, tetapi solusi untuk masalah tersebut sudah bekerja. Midjourney, DALL-E 2, dan platform lainnya pada akhirnya akan dapat meminimalkan jari unik, jika tidak menghapusnya sepenuhnya.
Kemajuan di bidang AI lainnya memastikan teknologi terus berkembang, dan pengembangnya selalu mempelajari cara baru untuk menerapkan dan memperbaikinya.