Model bahasa besar (LLM) adalah teknologi dasar yang telah mendorong kebangkitan meteorik chatbot AI generatif. Alat seperti ChatGPT, Google Bard, dan Bing Chat semuanya bergantung pada LLM untuk menghasilkan respons seperti manusia terhadap permintaan dan pertanyaan Anda.

Tapi apa itu LLM, dan bagaimana cara kerjanya? Di sini kami berangkat untuk mengungkap LLM.

Apa itu Model Bahasa Besar?

Dalam istilah yang paling sederhana, LLM adalah basis data data teks yang sangat besar yang dapat direferensikan untuk menghasilkan respons seperti manusia terhadap permintaan Anda. Teks berasal dari berbagai sumber dan dapat berjumlah miliaran kata.

Di antara sumber umum data teks yang digunakan adalah:

  • literatur: LLM sering berisi literatur kontemporer dan klasik dalam jumlah besar. Ini bisa termasuk buku, puisi, dan drama.
  • Konten daring: LLM paling sering berisi gudang besar konten online, termasuk blog, konten web, pertanyaan & tanggapan forum, dan teks online lainnya.
  • Berita dan urusan saat ini: Beberapa, tetapi tidak semua, LLM dapat mengakses topik berita terkini. LLM tertentu, seperti GPT-3.5, dibatasi dalam hal ini.
    instagram viewer
  • Media sosial: Media sosial mewakili sumber daya bahasa alami yang sangat besar. LLM menggunakan teks dari platform utama seperti Facebook, Twitter, dan Instagram.

Tentu saja, memiliki basis data teks yang besar adalah satu hal, tetapi LLM perlu dilatih untuk memahaminya guna menghasilkan tanggapan seperti manusia. Bagaimana melakukannya, inilah yang akan kita bahas selanjutnya.

Bagaimana Cara Kerja LLM?

Bagaimana LLM menggunakan repositori ini untuk membuat tanggapan mereka? Langkah pertama adalah menganalisis data menggunakan proses yang disebut deep learning.

Pembelajaran mendalam digunakan untuk mengidentifikasi pola dan nuansa bahasa manusia. Ini termasuk mendapatkan pemahaman tentang tata bahasa dan sintaksis. Namun yang terpenting, ini juga mencakup konteks. Memahami konteks adalah bagian penting dari LLM.

Mari kita lihat contoh bagaimana LLM dapat menggunakan konteks.

Prompt pada gambar berikut menyebutkan melihat kelelawar di malam hari. Dari sini, ChatGPT mengerti bahwa kami berbicara tentang binatang dan bukan, misalnya, tongkat baseball. Tentu saja, chatbot lain suka Bing Chat atau Google Bard mungkin menjawab ini sama sekali berbeda.

Namun, itu tidak sempurna, dan seperti yang ditunjukkan contoh ini, terkadang Anda perlu memberikan informasi tambahan untuk mendapatkan respons yang diinginkan.

Dalam contoh ini, kami dengan sengaja melemparkan sedikit bola melengkung untuk menunjukkan betapa mudahnya konteks hilang. Tetapi manusia juga dapat salah memahami konteks pertanyaan, dan itu hanya membutuhkan dorongan ekstra untuk memperbaiki jawabannya.

Untuk menghasilkan tanggapan ini, LLM menggunakan teknik yang disebut generasi bahasa alami (NLG). Ini melibatkan memeriksa input dan menggunakan pola yang dipelajari dari repositori datanya untuk menghasilkan respons yang benar dan relevan secara kontekstual.

Tapi LLM lebih dalam dari ini. Mereka juga dapat menyesuaikan balasan agar sesuai dengan nada emosional masukan. Ketika dikombinasikan dengan pemahaman kontekstual, kedua aspek tersebut adalah pendorong utama yang memungkinkan LLM menciptakan respons seperti manusia.

Singkatnya, LLM menggunakan basis data teks besar dengan kombinasi pembelajaran mendalam dan teknik NLG untuk membuat respons seperti manusia terhadap permintaan Anda. Tetapi ada batasan untuk apa yang bisa dicapai ini.

Apa Keterbatasan LLM?

LLM mewakili pencapaian teknologi yang mengesankan. Namun teknologinya masih jauh dari sempurna, dan masih banyak keterbatasan mengenai apa yang dapat mereka capai. Beberapa yang lebih terkenal tercantum di bawah ini:

  1. Pemahaman kontekstual: Kami menyebutkan ini sebagai sesuatu yang dimasukkan oleh LLM ke dalam jawaban mereka. Namun, mereka tidak selalu melakukannya dengan benar dan seringkali tidak dapat memahami konteksnya, yang mengarah pada jawaban yang tidak tepat atau salah.
  2. Bias: Bias apa pun yang ada dalam data pelatihan seringkali dapat muncul dalam respons. Ini termasuk bias terhadap jenis kelamin, ras, geografi, dan budaya.
  3. Kewajaran: Akal sehat sulit diukur, tetapi manusia mempelajarinya sejak usia dini hanya dengan mengamati dunia di sekitar mereka. LLM tidak memiliki pengalaman bawaan ini untuk digunakan kembali. Mereka hanya memahami apa yang telah diberikan kepada mereka melalui data pelatihan mereka, dan ini tidak memberi mereka pemahaman yang benar tentang dunia tempat mereka berada.
  4. LLM hanya sebagus data pelatihannya: Akurasi tidak pernah bisa dijamin. Pepatah komputer lama "Garbage In, Garbage Out" merangkum batasan ini dengan sempurna. LLM hanya sebagus kualitas dan kuantitas data pelatihan mereka.

Ada juga argumen bahwa masalah etika dapat dianggap sebagai batasan LLM, namun subjek ini berada di luar cakupan artikel ini.

3 Contoh LLM Populer

Kemajuan AI yang berkelanjutan sekarang sebagian besar didukung oleh LLM. Jadi meskipun mereka bukan teknologi baru, mereka pasti telah mencapai titik momentum kritis, dan sekarang ada banyak model.

Berikut adalah beberapa LLM yang paling banyak digunakan.

1. GPT

Generatif Pre-trained Transformer (GPT) mungkin merupakan LLM yang paling banyak dikenal. GPT-3.5 memperkuat platform ChatGPT yang digunakan untuk contoh di artikel ini, sedangkan versi terbaru, GPT-4, tersedia melalui langganan ChatGPT Plus. Microsoft juga menggunakan versi terbaru di platform Bing Chat-nya.

2. LaMDA

Ini adalah LLM awal yang digunakan oleh Google Bard, chatbot AI Google. Versi yang awalnya diluncurkan oleh Bard digambarkan sebagai versi "ringan" dari LLM. Iterasi PaLM yang lebih kuat dari LLM menggantikan ini.

3. BERT

BERT adalah singkatan dari Bi-directional Encoder Representation dari Transformers. Karakteristik dua arah dari model membedakan BERT dari LLM lain seperti GPT.

Lebih banyak LLM telah dikembangkan, dan cabang umum dari LLM utama. Saat mereka berkembang, ini akan terus tumbuh dalam kompleksitas, akurasi, dan relevansi. Tapi bagaimana masa depan LLM?

Masa Depan LLM

Ini pasti akan membentuk cara kita berinteraksi dengan teknologi di masa depan. Penggunaan model yang cepat seperti ChatGPT dan Bing Chat adalah bukti dari fakta ini. Dalam jangka pendek, AI tidak mungkin menggantikan Anda di tempat kerja. Tapi masih ada ketidakpastian tentang seberapa besar peran ini dalam hidup kita di masa depan.

Argumen etis mungkin memiliki suara dalam bagaimana kita mengintegrasikan alat-alat ini ke dalam masyarakat. Namun, mengesampingkan hal ini, beberapa perkembangan LLM yang diharapkan meliputi:

  1. Peningkatan Efisiensi:Dengan LLM menampilkan ratusan juta parameter, mereka sangat haus sumber daya. Dengan peningkatan perangkat keras dan algoritme, mereka cenderung menjadi lebih hemat energi. Ini juga akan mempercepat waktu respons.
  2. Peningkatan Kesadaran Kontekstual: LLM adalah pelatihan mandiri; semakin banyak penggunaan dan umpan balik yang mereka dapatkan, semakin baik jadinya. Yang penting, ini tanpa rekayasa besar lebih lanjut. Seiring kemajuan teknologi, ini akan melihat peningkatan dalam kemampuan bahasa dan kesadaran kontekstual.
  3. Dilatih untuk Tugas Tertentu: Alat Jack-of-all-trade yang merupakan wajah publik LLM rentan terhadap kesalahan. Namun saat mereka berkembang dan pengguna melatihnya untuk kebutuhan khusus, LLM dapat memainkan peran besar dalam bidang seperti kedokteran, hukum, keuangan, dan pendidikan.
  4. Integrasi Lebih Besar: LLM bisa menjadi asisten digital pribadi. Pikirkan Siri tentang steroid, dan Anda mendapatkan idenya. LLM dapat menjadi asisten virtual yang membantu Anda dalam segala hal mulai dari menyarankan makanan hingga menangani korespondensi Anda.

Ini hanyalah beberapa area di mana LLM cenderung menjadi bagian yang lebih besar dari cara kita hidup.

LLM Transformasi dan Mendidik

LLM membuka dunia kemungkinan yang menarik. Peningkatan pesat chatbots seperti ChatGPT, Bing Chat, dan Google Bard adalah bukti sumber daya yang dituangkan ke lapangan.

Proliferasi sumber daya seperti itu hanya dapat membuat alat ini menjadi lebih kuat, serbaguna, dan akurat. Aplikasi potensial dari alat semacam itu sangat luas, dan saat ini, kami hanya menggores permukaan dari sumber daya baru yang luar biasa.