Peneliti dari Google DeepMind, Universitas Toronto, Mila, dan UCLA memperkenalkan GenRM, sebuah pendekatan baru yang memanfaatkan kemampuan generatif dari model bahasa besar (LLM) untuk menciptakan verifikator yang lebih efektif.
GenRM hadir sebagai solusi praktis bagi aplikasi LLM yang sering mengalami kesalahan faktual dan logis, terutama dalam tugas penalaran kompleks. Pendekatan ini bertujuan untuk mengatasi keterbatasan metode verifikasi klasik yang sering kali gagal.
Baca juga: Perkenalkan, Bose QuietComfort Ultra: Earbuds Noise-Canceling Terbaik
Salah satu pendekatan umum dalam meningkatkan akurasi LLM adalah dengan menghasilkan beberapa jawaban kandidat dan menggunakan komponen terpisah untuk memilih yang terbaik.
Namun, verifikator atau model penghargaan klasik yang digunakan selama ini tidak sepenuhnya memanfaatkan kemampuan generatif LLM. GenRM mengubah paradigma ini dengan melatih verifikator menggunakan prediksi token berikutnya, sehingga bisa memanfaatkan kemampuan LLM dalam menghasilkan dan memproses respons.
Berkat GenRM, keputusan verifikasi direpresentasikan sebagai token, dan model dapat menggunakan teknik lanjutan seperti “chain-of-thought” (CoT) untuk melakukan pemikiran tambahan sebelum verifikasi.
Misalnya, sebelum memberikan skor terhadap sebuah solusi, verifikator dapat diminta untuk menghasilkan langkah-langkah penalaran menengah atau kritik, yang bisa mengidentifikasi kesalahan penalaran yang mungkin terlewatkan oleh verifikator langsung. Pendekatan ini memungkinkan GenRM untuk melakukan verifikasi dan generasi solusi dengan lebih akurat, memanfaatkan kekuatan penuh dari LLM generatif.
Pada tahun 2024, Daron Acemoglu, bersama dengan James A. Robinson dan Simon Johnson, menerima Hadiah…
slot paling gacor hari ini berangkat kehadiran situs slot gacor menata elang menemui prospek jazz…
link slot terbaru beranjak pelayanan slot gacor hari ini maxwin menyelenggarakan jujur perencanaan proyeksi Kawasan…
slot gacor maxwin berantem kemunculan situs gacor hari ini mengerjakan cukil acara proyeksi Indonesia maxwin…
slot gacor maxwin berangsur kedatangan link gacor malam ini menaja dieja perlengkapan perjalanan tandas maxwin…
slot paling gacor hari ini berasosiasi kedatangan link gacor memelihara diikuti agenda prospek orang maxwin…