Ketika manusia melihat pemandangan atau gambar, mereka memahaminya—objek apa yang ada di dalamnya dan apa yang terjadi jika tindakan sedang berlangsung. Komputer, di sisi lain, hanya memproses data digital yang menggambarkan nilai warna setiap piksel. Bagi manusia, mengenali pizza di atas meja yang berantakan itu mudah. Tetapi sampai saat ini, komputer tidak akan dapat melakukan tugas yang sama.

Visi komputer, atau CV, memungkinkan komputer untuk dapat memilih informasi penting dari input visual dan membuat prediksi dan rekomendasi yang akurat berdasarkan informasi tersebut.

Bagaimana Visi Komputer Bekerja?

Sebelum visi komputer, untuk membuat program yang mengenali gambar tertentu, seseorang harus melakukan berjam-jam pekerjaan kaki manual. Pertama, database gambar serupa harus dikumpulkan.

Kemudian, gambar-gambar ini harus dianalisis, diukur, dan dijelaskan secara manual dengan data yang relevan yang menurut peneliti dapat mengidentifikasi objek yang dimaksud (seperti warna, ukuran, dan bentuk). Hanya dengan begitu perangkat lunak dapat digunakan untuk membuat prediksi.

instagram viewer

Di sisi lain, visi komputer mengotomatiskan seluruh proses ini menggunakan pendekatan pembelajaran mesin yang dikenal sebagai pembelajaran mendalam. Pembelajaran mendalam menggunakan jaringan saraf berlapis-lapis dengan ratusan lapisan potensial. Dalam kasus gambar, ini biasanya jaringan saraf convolutional (CNN).

Menjelaskan secara rinci bagaimana pembelajaran mendalam dan jaringan saraf bekerja jauh di luar cakupan artikel ini. Pada dasarnya, sejumlah besar data dimasukkan ke dalam jaringan saraf. Jaringan saraf menganalisis data secara berulang hingga dapat membentuk prediksi yang akurat tentangnya.

Dalam kasus CNN yang digunakan untuk tugas visi komputer, jaringan saraf mengambil data melalui beberapa langkah. Pertama, ia menciutkan gambar menjadi beberapa bagian (piksel individual atau kelompok piksel yang diberi tag sebelumnya).

Kemudian, itu membuat prediksi tentang apa yang ada di bagian gambar yang berbeda (seperti tepi keras atau objek tertentu). Ini memeriksa keakuratan prediksi ini berulang kali dan sedikit mengubah bagian dari algoritma setiap kali hingga menjadi sangat akurat.

Komputer sekarang sangat kuat sehingga mereka dapat menganalisis gambar lebih cepat daripada otak manusia, terutama setelah mereka belajar mengenali pola tertentu. Dengan cara ini, mudah untuk melihat bagaimana algoritme pembelajaran mendalam dapat melampaui kemampuan manusia.

Apa Jenis Visi Komputer?

Visi komputer melibatkan analisis dan pemahaman gambar dan output dari prediksi atau keputusan yang relevan tentang gambar. Ada berbagai tugas yang akan digunakan visi komputer untuk mencapai tujuan ini. Beberapa di antaranya adalah:

  • Klasifikasi Gambar: Jenis gambar dikenali. Misalnya, apakah itu wajah, lanskap, atau objek seseorang. Tugas semacam ini dapat digunakan untuk mengidentifikasi dan mengklasifikasikan gambar dengan cepat. Salah satu kegunaannya adalah secara otomatis mengenali dan memblokir konten yang tidak pantas di media sosial.
  • Pengenalan Objek: Mirip dengan klasifikasi gambar, pengenalan objek dapat mengidentifikasi objek tertentu dalam suatu pemandangan—seperti pizza di atas meja yang berantakan.
  • Deteksi Tepi: Penggunaan visi komputer yang umum, dan biasanya langkah pertama dalam pendeteksian objek, adalah mengidentifikasi tepi keras dalam sebuah gambar.
  • Identifikasi Objek: Ini adalah pengenalan contoh individu dari suatu objek atau gambar, seperti mengidentifikasi orang tertentu, sidik jari, atau kendaraan.
  • Deteksi Objek: Deteksi adalah identifikasi sifat tertentu dalam gambar, seperti tulang yang retak dalam sinar-X.
  • Segmentasi Objek: Ini adalah identifikasi piksel mana dalam gambar milik objek yang bersangkutan.
  • Pelacakan Objek: Dalam urutan video, setelah suatu objek dikenali, objek tersebut dapat dengan mudah dilacak di seluruh video.
  • Pemulihan Gambar: Kabur, noise, dan artefak gambar lainnya dapat dihilangkan dengan mengidentifikasi secara akurat di mana objek versus latar belakang berada dalam gambar.

Contoh Visi Komputer

Kecerdasan buatan adalah sudah digunakan di beberapa industri dengan efek mengejutkan, yang berlaku untuk visi komputer. Berikut adalah beberapa contoh CV yang sudah digunakan saat ini.

Pengenalan wajah

Pengenalan wajah adalah salah satu cara utama yang digunakan computer vision saat ini. Jika dibandingkan dengan basis data wajah yang dikenal, algoritme visi komputer dapat mengidentifikasi orang secara sangat akurat.

  • Media sosial menganalisis gambar dan secara otomatis menandai pengguna yang memiliki pilihan gambar yang bagus.
  • Laptop, telepon, dan perangkat keamanan dapat mengidentifikasi orang untuk mengizinkan akses.
  • Penegakan hukum menggunakan pengenalan wajah dalam sistem CCTV untuk mengidentifikasi tersangka.

Obat

Visi komputer saat ini digunakan dalam perawatan kesehatan untuk memberikan diagnosis yang lebih cepat dan lebih akurat daripada yang dapat dibuat oleh para ahli. Banyak aplikasi melibatkan analisis gambar sinar-X, CT, atau MRI untuk kondisi tertentu, termasuk penyakit saraf, tumor, dan tulang patah atau patah.

Mobil Mengemudi Sendiri

Kendaraan otonom perlu memahami lingkungannya untuk mengemudi dengan aman. Ini berarti mengenali jalan, jalur, lampu lalu lintas, kendaraan lain, pejalan kaki, dan lainnya. Semua tugas ini menggunakan sistem visi komputer secara real-time untuk menghindari tabrakan dan berkendara dengan aman.

Visi Komputer Menantang

Penerapan visi komputer saat ini sudah mulai mengubah cara kita bekerja di berbagai industri. Dari mampu mendeteksi peralatan yang rusak atau rusak hingga mendiagnosis kanker secara akurat, computer vision memiliki kemampuan untuk meningkatkan sistem dan menyelamatkan nyawa.

Tapi, itu bukan tanpa tantangan. Penglihatan komputer masih jauh dari penglihatan manusia. Kami memiliki ribuan tahun evolusi yang memungkinkan kami untuk mengenali dan memahami hampir semua yang terjadi di sekitar kami secara real-time. Tapi, kita tidak tahu bagaimana otak manusia melakukan tugas-tugas ini.

Pembelajaran mendalam adalah langkah besar ke arah yang benar, tetapi masih membutuhkan banyak pekerjaan untuk membuat sistem yang dapat melakukan tugas yang dapat dilakukan manusia dengan sangat mudah, seperti mengidentifikasi mobil di jalan. Ini karena komputer melakukan tugas terbatas dengan sangat efektif. Mengembangkan komputer yang dapat memahami kompleksitas total dunia visual adalah permainan bola yang sama sekali berbeda.

Karena lebih banyak penelitian masuk ke aplikasi AI dan biologi manusia, kemungkinan besar kita akan melihat ledakan kemungkinan penggunaan visi komputer dalam waktu dekat.

Surel
Apa Itu Algoritma Pembelajaran Mesin? Inilah Cara Mereka Bekerja

Algoritme pembelajaran mesin dirancang untuk membuat hidup lebih mudah dan meningkatkan sistem, tetapi mereka bisa serba salah dengan konsekuensi buruk.

Baca Selanjutnya

Topik-topik yang berkaitan
  • Teknologi Dijelaskan
  • Pemrograman
  • Kecerdasan buatan
  • Jaringan Saraf
Tentang Penulis
Jake Harfield (16 Artikel Diterbitkan)

Jake Harfield adalah seorang penulis lepas yang tinggal di Perth, Australia. Ketika dia tidak sedang menulis, dia biasanya berada di semak-semak memotret satwa liar setempat. Anda dapat mengunjunginya di www.jakeharfield.com

More From Jake Harfield

Berlangganan newsletter kami

Bergabunglah dengan buletin kami untuk kiat teknologi, ulasan, ebook gratis, dan penawaran eksklusif!

Satu langkah lagi…!

Harap konfirmasi alamat email Anda di email yang baru saja kami kirimkan.

.