GPT-4 telah hadir, dan ini adalah fitur baru yang harus Anda periksa.

OpenAI akhirnya meluncurkan pembaruan GPT yang sangat dinantikan, GPT-4. Model Bahasa Besar (LLM) hadir dengan beberapa fitur dan kemampuan baru yang kuat yang telah mengejutkan pengguna di seluruh dunia.

Selain secara signifikan lebih baik daripada GPT-3.5, LLM yang mendukung chatbot virus OpenAI, ChatGPT, GPT-4 dapat memahami input yang lebih kompleks, memiliki batas input karakter yang jauh lebih besar, memiliki kemampuan multimodal, dan dilaporkan lebih aman menggunakan.

1. GPT-4 Dapat Memahami Input yang Lebih Kompleks

Salah satu fitur baru terbesar GPT-4 adalah kemampuannya untuk memahami petunjuk yang lebih kompleks dan bernuansa. Berdasarkan OpenAI, GPT-4 "menunjukkan kinerja tingkat manusia pada berbagai tolok ukur profesional dan akademik."

Ini ditunjukkan dengan menempatkan GPT-4 melalui beberapa ujian tingkat manusia dan tes standar, seperti SAT, BAR, dan GRE, tanpa pelatihan khusus. GTP-4 tidak hanya memahami dan menyelesaikan tes ini dengan skor yang relatif tinggi, tetapi juga mengalahkan pendahulunya, GPT-3.5, setiap saat.

instagram viewer

Kredit Gambar: OpenAI

Kemampuan untuk memahami petunjuk input yang lebih bernuansa juga dibantu oleh fakta bahwa GPT-4 memiliki batas kata yang jauh lebih besar. Model baru dapat menangani perintah input hingga 25.000 kata (untuk konteks, GPT-3.5 dibatasi hingga 8.000 kata). Hal ini secara langsung akan memengaruhi detail yang dapat dimasukkan pengguna ke dalam prompt mereka, sehingga memberi model lebih banyak informasi untuk dikerjakan dan menghasilkan keluaran yang lebih panjang.

GPT-4 juga mendukung lebih dari 26 bahasa, termasuk bahasa sumber daya rendah seperti Latvia, Welsh, dan Swahili. Ketika dibandingkan dengan akurasi tiga pukulan pada benchmark MMLU, GPT-4 mengalahkan GPT-3.5 serta LLM terkemuka lainnya seperti PaLM dan Chinchilla dalam hal performa berbahasa Inggris dalam 24 bahasa.

2. Kemampuan Multimoda

Versi sebelumnya dari ChatGPT terbatas hanya pada permintaan teks. Sebaliknya, salah satu fitur terbaru GPT-4 adalah kemampuan multimodalnya. Model dapat menerima perintah teks dan gambar.

Ini berarti bahwa AI dapat menerima gambar sebagai input dan menafsirkan serta memahaminya seperti perintah teks. Kemampuan ini mencakup semua ukuran dan jenis gambar dan teks, termasuk dokumen yang menggabungkan keduanya, sketsa yang digambar tangan, dan bahkan tangkapan layar.

Namun, kemampuan membaca gambar GPT-4 lebih dari sekadar menafsirkannya. OpenAI memamerkan ini di aliran pengembangnya (di atas), di mana mereka memberi GPT-4 maket situs web lelucon yang digambar tangan. Model ditugaskan untuk menulis kode HTML dan JavaScript untuk mengubah mockup menjadi situs web sambil mengganti lelucon dengan yang sebenarnya.

GPT-4 menulis kode saat menggunakan tata letak yang ditentukan dalam mockup. Setelah pengujian, kode menghasilkan situs yang berfungsi, seperti yang bisa Anda tebak, lelucon yang sebenarnya. Apakah itu berarti Kemajuan AI akan berarti akhir dari pemrograman? Tidak cukup, tapi itu masih merupakan fitur yang akan berguna dalam membantu pemrogram.

Meskipun fitur ini menjanjikan, fitur ini masih dalam pratinjau penelitian dan tidak tersedia untuk umum. Selain itu, model membutuhkan banyak waktu untuk memproses input visual, dengan OpenAI sendiri menyatakan bahwa perlu kerja keras dan waktu untuk menjadi lebih cepat.

3. Steerabilitas Lebih Besar

OpenAI juga mengklaim bahwa GPT-4 memiliki tingkat kemampuan kemudi yang tinggi. Ini juga mempersulit AI untuk merusak karakter, yang berarti kecil kemungkinannya untuk gagal saat diimplementasikan dalam aplikasi untuk memainkan karakter tertentu.

Pengembang dapat menentukan gaya dan tugas AI mereka dengan menjelaskan arah dalam pesan "sistem". Pesan-pesan ini memungkinkan pengguna API untuk menyesuaikan pengalaman pengguna dalam batas-batas tertentu. Karena pesan-pesan ini juga merupakan cara termudah untuk melakukan "jailbreak" pada model, mereka juga berupaya membuatnya lebih aman. Demo untuk GPT-4 menjelaskan hal ini dengan membuat pengguna mencoba menghentikan GPT-4 dari menjadi tutor Socrates dan menjawab pertanyaan mereka. Namun, model tersebut menolak untuk merusak karakter.

4. Keamanan

OpenAI menghabiskan waktu enam bulan untuk membuat GPT-4 lebih aman dan selaras. Perusahaan mengklaim bahwa 82% lebih kecil kemungkinannya untuk menanggapi permintaan konten yang tidak pantas atau dilarang, 29% lebih mungkin untuk menanggapi merespons sesuai dengan kebijakan OpenAI terhadap permintaan sensitif, dan 40% lebih mungkin menghasilkan respons faktual dibandingkan dengan GPT-3.5.

Itu tidak sempurna, dan Anda masih bisa mengharapkannya untuk "berhalusinasi" dari waktu ke waktu dan prediksinya bisa salah. Tentu, GPT-4 memiliki persepsi dan kekuatan prediksi yang lebih baik, tetapi Anda tetap tidak boleh begitu saja mempercayai AI.

5. Peningkatan Kinerja

Selain mengevaluasi kinerja model pada ujian manusia, OpenAI juga mengevaluasi bot pada tolok ukur tradisional yang dirancang untuk model pembelajaran mesin.

Ia mengklaim bahwa GPT-4 "jauh mengungguli" LLM yang ada dan "model paling canggih". Tolok ukur ini meliputi MMLU yang disebutkan di atas, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval, dan Drop, semuanya menguji kemampuan individu.

Anda akan menemukan hasil serupa saat membandingkan kinerja pada tolok ukur visi akademik. Tes yang dijalankan termasuk VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA, dan LSMDC, yang semuanya GPT-4 teratas. Namun, OpenAI telah menyatakan bahwa hasil GPT-4 dalam pengujian ini "tidak sepenuhnya mewakili tingkat kemampuannya" karena para peneliti terus menemukan hal-hal baru dan lebih menantang yang dapat ditangani oleh model tersebut.

Langkah Kecil untuk GPT-4, Lompatan Raksasa untuk AI

Dengan akurasi yang lebih tinggi, keamanan penggunaan, dan kemampuan tingkat lanjut, GPT-4 telah dirilis ke publik melalui paket langganan bulanan ChatGPT+ dengan biaya 20 per bulan. Selain itu, OpenAI telah bermitra dengan berbagai organisasi untuk mulai membangun produk yang berorientasi konsumen dengan GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes, dan Khan Academy, antara lain, telah menerapkan GPT-4 di produk mereka.

GPT-4 mungkin merupakan pembaruan bertahap dibandingkan GPT-3.5, tetapi ini merupakan kemenangan besar bagi AI secara keseluruhan. Saat model menjadi lebih mudah diakses, baik untuk pengguna rata-rata maupun pengembang melalui API-nya, sepertinya model ini akan menjadi contoh yang bagus untuk implementasi LLM di berbagai bidang.