Model GPT OpenAI telah merevolusi pemrosesan bahasa alami (NLP), tetapi kecuali Anda membayar untuk premium akses ke layanan OpenAI, Anda tidak akan dapat menyempurnakan dan mengintegrasikan model GPT mereka ke dalam aplikasi. Selanjutnya, OpenAI akan memiliki akses ke semua percakapan Anda, yang mungkin menjadi masalah keamanan jika Anda menggunakan ChatGPT untuk bisnis dan area lain yang lebih sensitif dalam hidup Anda. Jika Anda tidak tertarik dengan ini, Anda mungkin ingin mencoba GPT4All.
Jadi apa sebenarnya GPT4All itu? Bagaimana cara kerjanya, dan mengapa menggunakannya melalui ChatGPT?
Apa itu GPT4All?
GPT4All adalah ekosistem sumber terbuka yang digunakan untuk mengintegrasikan LLM ke dalam aplikasi tanpa membayar langganan platform atau perangkat keras. Itu dibuat oleh Nomic AI, sebuah perusahaan kartografi informasi yang bertujuan untuk meningkatkan akses ke sumber daya AI.
GPT4All dirancang untuk berjalan di PC modern hingga relatif modern tanpa memerlukan koneksi internet atau bahkan GPU! Ini dimungkinkan karena sebagian besar model yang disediakan oleh GPT4All telah dikuantisasi menjadi sekecil beberapa gigabyte, hanya membutuhkan RAM 4–16 GB untuk menjalankannya.
Ini memungkinkan bisnis, organisasi, dan peneliti independen yang lebih kecil untuk menggunakan dan mengintegrasikan LLM untuk aplikasi tertentu. Dan dengan GPT4All yang dapat diinstal dengan mudah melalui penginstal sekali klik, orang sekarang dapat menggunakan GPT4All dan banyak dari LLM-nya untuk pembuatan konten, menulis kode, memahami dokumen, dan informasi mengumpulkan.
Mengapa Menggunakan GPT4ALL Melalui ChatGPT?
Ada beberapa alasan mengapa Anda mungkin ingin menggunakan GPT4All melalui ChatGPT.
- Portabilitas: Model yang disediakan oleh GPT4All hanya memerlukan empat hingga delapan gigabyte penyimpanan memori, tidak memerlukan GPU untuk dijalankan, dan dapat dengan mudah disimpan di USB flash drive dengan penginstal satu klik GPT4All. Ini membuat GPT4All dan modelnya benar-benar portabel dan dapat digunakan di hampir semua komputer modern di luar sana.
- Privasi dan Keamanan: Seperti yang dijelaskan sebelumnya, kecuali Anda memiliki akses ke ChatGPT Plus, semua konversi ChatGPT Anda dapat diakses oleh OpenAI. GPT4All berfokus pada transparansi dan privasi data; data Anda hanya akan disimpan di perangkat keras lokal Anda kecuali jika Anda sengaja membagikannya dengan GPT4All untuk membantu mengembangkan model mereka.
- Modus Luring: GPT adalah model berpemilik yang membutuhkan akses API dan koneksi internet konstan untuk menanyakan atau mengakses model. Jika Anda kehilangan koneksi internet atau mengalami masalah server, Anda tidak akan memiliki akses ke ChatGPT. Ini tidak terjadi dengan GPT4All. Karena semua data sudah disimpan dalam paket berukuran empat hingga delapan gigabyte, dan inferensi dilakukan secara lokal, Anda tidak memerlukan koneksi internet untuk mengakses model apa pun di GPT4All. Anda dapat terus mengobrol dan menyempurnakan model Anda bahkan tanpa koneksi internet.
- Gratis dan Sumber Terbuka: Beberapa LLM yang disediakan oleh GPT4All dilisensikan di bawah GPL-2. Hal ini memungkinkan siapa saja menyempurnakan dan mengintegrasikan model mereka sendiri untuk penggunaan komersial tanpa perlu membayar lisensi.
Bagaimana GPT4All Bekerja
Seperti yang telah dibahas sebelumnya, GPT4All adalah ekosistem yang digunakan untuk melatih dan menerapkan LLM secara lokal di komputer Anda, yang merupakan prestasi luar biasa! Biasanya, memuat LLM 25-30 GB standar akan membutuhkan RAM 32 GB dan GPU tingkat perusahaan.
Sebagai perbandingan, LLM yang dapat Anda gunakan dengan GPT4All hanya membutuhkan penyimpanan 3GB-8GB dan dapat berjalan pada RAM 4GB–16GB. Hal ini memungkinkan menjalankan seluruh LLM pada perangkat edge tanpa memerlukan GPU atau bantuan cloud eksternal.
Persyaratan perangkat keras untuk menjalankan LLM di GPT4All telah berkurang secara signifikan berkat kuantisasi jaringan neural. Dengan mengurangi bobot presisi dan aktivasi di jaringan neural, banyak model yang disediakan oleh GPT4All dapat dijalankan di sebagian besar komputer yang relatif modern.
Data pelatihan yang digunakan dalam beberapa model yang tersedia dikumpulkan melalui "tumpukan", yang hanya merupakan data tergores dari konten yang dirilis secara publik di internet. Data tersebut kemudian dikirim ke database Atlas AI Nomic AI, yang dapat dilihat berdasarkan korelasi pada peta vektor 2D yang mudah dilihat (juga dikenal sebagai database vektor AI).
Dengan Nomic AI melatih model Groovy dan menggunakan data yang tersedia untuk umum, Nomic AI dapat merilis model tersebut pada lisensi GPL terbuka yang memungkinkan siapa saja untuk menggunakannya, bahkan untuk aplikasi komersial.
Cara Install GPT4All
Menginstal GPT4All itu sederhana, dan sekarang GPT4All versi 2 telah dirilis, jadi lebih mudah! Cara terbaik untuk menginstal GPT4All 2 adalah mengunduh penginstal sekali klik:
Unduh:GPT4All untuk Windows, macOS, atau Linux (Gratis)
Petunjuk berikut adalah untuk Windows, tetapi Anda dapat menginstal GPT4All di setiap sistem operasi utama.
Setelah diunduh, klik dua kali pada penginstal dan pilih Install. Windows Defender mungkin melihat penginstalan sebagai berbahaya karena proses Microsoft untuk memberikan tanda tangan yang valid untuk aplikasi pihak ke-3 dapat memakan waktu lama. Namun, ini harus segera diperbaiki. Saat menulis, selama Anda mengunduh aplikasi GPT4All dari situs resminya, Anda akan aman. Klik Tetap Instal untuk menginstal GPT4All.
Setelah Anda membuka aplikasi, Anda harus memilih model yang akan digunakan. GPT4ALL memberi Anda beberapa model, yang semuanya akan memiliki kekuatan dan kelemahannya. Untuk mengetahui model mana yang akan diunduh, berikut adalah tabel yang menunjukkan kekuatan dan kelemahannya.
Model |
Ukuran |
Catatan |
Parameter |
Jenis |
Kuantisasi |
---|---|---|---|---|---|
Hermes |
7,58 GB |
|
13 Miliar |
LLaMA |
q4_0 |
GPT4All Falcon |
3,78 GB |
|
7 Miliar |
Elang |
q4_0 |
Asyik |
8 GB |
|
7 Miliar |
GPT-J |
q4_0 |
ChatGPT-3.5 Turbo |
Minimal |
|
? |
GPT |
NA |
ObrolanGPT-4 |
Minimal |
|
? |
GPT |
NA |
tertidur |
7,58 GB |
|
13 Miliar |
LLaMA |
q4_0 |
Obrolan MPT |
4,52 GB |
|
7 Miliar |
MPT |
q4_0 |
Orca |
3,53 GB |
|
7 Miliar |
OpenLLaMA |
q4_0 |
Vicuna |
3,92 GB |
|
7 Miliar |
LLaMA |
q4_2 |
Penyihir |
3,92 GB |
|
7 Miliar |
LLaMA |
q4_2 |
Penyihir Tanpa Sensor |
7,58 GB |
|
13 Miliar |
LLaMA |
q4_0 |
Perlu diingat bahwa model yang disediakan memiliki tingkat batasan yang berbeda. Tidak semua model dapat digunakan secara komersial secara gratis; beberapa akan membutuhkan lebih banyak sumber daya perangkat keras, sementara yang lain memerlukan kunci API. Model paling tidak ketat yang tersedia di GPT4All adalah Groovy, GPT4All Falcon, dan Orca.
Bisakah Anda Melatih Model GPT4All?
Ya, tapi bukan versi terkuantisasi. Untuk menyempurnakan model GPT4All secara efektif, Anda perlu mengunduh model mentah dan menggunakan GPU tingkat perusahaan seperti Akselerator Insting AMD atau GPU Ampere atau Hopper NVIDIA. Selain itu, Anda perlu melatih model melalui kerangka kerja pelatihan AI seperti LangChain, yang memerlukan beberapa pengetahuan teknis.
Menyempurnakan model GPT4All akan memerlukan beberapa sumber daya keuangan serta beberapa pengetahuan teknis, tetapi jika Anda hanya ingin memberi makan data khusus model GPT4All, Anda dapat terus latih model melalui pengambilan augmented generation (yang membantu model bahasa mengakses dan memahami informasi di luar pelatihan dasarnya untuk menyelesaikan tugas). Anda dapat melakukannya dengan meminta GPT4All untuk membuat model data kustom Anda sebelum mengajukan pertanyaan. Data khusus harus disimpan secara lokal, dan saat diminta, model harus dapat memberi Anda info yang pernah Anda berikan.
Haruskah Anda Menggunakan GTP4All?
Gagasan GPT4All adalah untuk menyediakan platform sumber terbuka dan bebas digunakan di mana orang dapat menjalankan model bahasa besar di komputer mereka. Saat ini, GPT4All dan model terkuantisasinya bagus untuk bereksperimen, mempelajari, dan mencoba berbagai LLM di lingkungan yang aman. Untuk beban kerja profesional, kami tetap merekomendasikan penggunaan ChatGPT karena modelnya jauh lebih mumpuni.
Secara keseluruhan, tidak ada alasan Anda harus membatasi diri pada satu. Karena kasus penggunaannya tidak tumpang tindih, Anda harus mencoba menggunakan keduanya.