World

Kecerdasan dan Pemahaman – O’Reilly


Saya belum banyak menulis tentang AI baru-baru ini. Tetapi diskusi baru-baru ini tentang Model Bahasa Besar (LLM) baru Google, dan klaimnya bahwa salah satu model ini (bernama Gopher) telah menunjukkan pemahaman membaca mendekati kinerja manusia, telah mendorong beberapa pemikiran tentang pemahaman, ambiguitas, kecerdasan, dan kemauan. (Ada baiknya membaca Apakah Model Besar Memahami Kami, makalah yang lebih komprehensif oleh Blaise Agüera y Arcas yang menuju ke arah yang sama.)

Apa yang dimaksud dengan pemahaman bacaan? Kita bisa mulai dengan definisi operasional sederhana: Pemahaman membaca adalah apa yang diukur dengan tes pemahaman bacaan. Definisi itu mungkin hanya memuaskan bagi orang-orang yang merancang tes ini dan administrator sekolah, tetapi juga menjadi dasar klaim Deep Mind. Kita semua pernah mengikuti tes ini: SAT, GRE, kotak tes dari kelas 6 yang (menurut saya) disebut SRE. Mereka cukup mirip: dapatkah pembaca mengekstrak fakta dari sebuah dokumen? Jack berjalan ke atas bukit. Jill bersama Jack ketika dia berjalan mendaki bukit. Mereka mengambil seember air: semacam itu.


Belajar lebih cepat. Menggali lebih dalam. Lihat lebih jauh.

Itu pemahaman kelas satu, bukan sekolah menengah, tetapi satu-satunya perbedaan nyata adalah bahwa teks dan fakta menjadi lebih kompleks seiring bertambahnya usia. Sama sekali tidak mengejutkan bagi saya bahwa LLM dapat melakukan ekstraksi fakta semacam ini. Saya menduga mungkin untuk melakukan pekerjaan yang cukup baik tanpa miliaran parameter dan terabyte data pelatihan (meskipun saya mungkin naif). Tingkat kinerja ini mungkin berguna, tetapi saya enggan menyebutnya sebagai “pemahaman”. Kami akan enggan untuk mengatakan bahwa seseorang memahami sebuah karya sastra, kata Faulkner’s Suara dan Kemarahan, jika yang mereka lakukan hanyalah mengekstrak fakta: Quentin meninggal. Dilsey bertahan. Benjy dikebiri.

Pemahaman adalah istilah yang didefinisikan dengan buruk, seperti banyak istilah yang sering muncul dalam diskusi tentang kecerdasan buatan: kecerdasan, kesadaran, kepribadian. Insinyur dan ilmuwan cenderung tidak nyaman dengan istilah yang tidak jelas dan ambigu. Humanis tidak. Saran pertama saya adalah bahwa istilah-istilah ini penting justru karena mereka didefinisikan dengan buruk, dan definisi yang tepat (seperti definisi operasional yang saya mulai) meniadakannya, membuatnya tidak berguna. Dan mungkin di situlah kita harus memulai definisi pemahaman yang lebih baik: sebagai kemampuan untuk menanggapi teks atau ucapan.

Definisi itu sendiri ambigu. Apa yang kita maksud dengan tanggapan? Tanggapan dapat berupa pernyataan (sesuatu yang dapat diberikan oleh LLM), atau tindakan (sesuatu yang tidak dapat dilakukan oleh LLM). Sebuah tanggapan tidak harus menunjukkan persetujuan, persetujuan, atau kepatuhan; yang harus dilakukan adalah menunjukkan bahwa ucapan itu diproses secara bermakna. Misalnya, saya dapat memberi tahu seekor anjing atau seorang anak untuk “duduk”. Baik anjing maupun anak dapat “duduk”; demikian juga, mereka berdua bisa menolak untuk duduk. Kedua tanggapan menunjukkan pemahaman. Tentu saja ada tingkat pemahaman. Saya juga dapat memberi tahu seekor anjing atau seorang anak untuk “mengerjakan pekerjaan rumah”. Seorang anak dapat mengerjakan pekerjaan rumahnya atau menolak; seekor anjing tidak dapat mengerjakan pekerjaan rumahnya, tetapi itu bukanlah penolakan, itu adalah ketidakpahaman.

Yang penting di sini adalah bahwa penolakan untuk mematuhi (sebagai lawan dari ketidakmampuan) hampir sama baiknya dengan indikator pemahaman sebagai kepatuhan. Membedakan antara penolakan, ketidakpahaman, dan ketidakmampuan mungkin tidak selalu mudah; seseorang (termasuk manusia dan anjing) dapat memahami permintaan, tetapi tidak dapat memenuhinya. “Kamu menyuruhku mengerjakan PR tapi guru belum memposting tugas” berbeda dengan “Kamu menyuruhku mengerjakan PR tapi lebih penting untuk melatih serulingku karena konsernya besok,” tetapi kedua tanggapan menunjukkan pemahaman. Dan keduanya berbeda dari anjing “Kamu menyuruhku mengerjakan pekerjaan rumahku, tapi aku tidak mengerti apa itu pekerjaan rumah.” Dalam semua kasus ini, kami membedakan antara membuat pilihan untuk melakukan (atau tidak melakukan) sesuatu, yang membutuhkan pemahaman, dan ketidakmampuan untuk melakukan sesuatu, dalam hal ini pemahaman atau ketidakpahaman mungkin terjadi, tetapi kepatuhan tidak.

Itu membawa kita ke masalah yang lebih penting. Ketika membahas AI (atau kecerdasan umum), mudah untuk melakukan kesalahan melakukan sesuatu yang rumit (seperti bermain Catur atau Go di tingkat kejuaraan) untuk kecerdasan. Seperti yang telah saya kemukakan, eksperimen-eksperimen ini lebih menunjukkan kepada kita apa itu kecerdasan daripada apa itu kecerdasan. Apa yang saya lihat di sini adalah bahwa kecerdasan mencakup kemampuan untuk berperilaku transgresif: kemampuan untuk memutuskan untuk tidak duduk ketika seseorang mengatakan “duduk.”1

Tindakan memutuskan untuk tidak duduk menyiratkan semacam pertimbangan, semacam pilihan: kemauan atau kemauan. Sekali lagi, tidak semua kecerdasan diciptakan sama. Ada hal-hal yang bisa membuat anak cerdas (pekerjaan rumah) yang tidak bisa dilakukan anjing; dan jika Anda pernah meminta seorang anak yang keras kepala untuk “duduk”, mereka mungkin akan menemukan banyak cara alternatif untuk “duduk”, membuat apa yang tampak sebagai perintah sederhana menjadi ambigu. Anak-anak adalah penafsir yang sangat baik dari novel Dostoevsky Catatan dari Bawah Tanah, di mana narator bertindak melawan kepentingannya sendiri hanya untuk membuktikan bahwa ia memiliki kebebasan untuk melakukannya, kebebasan yang lebih penting baginya daripada konsekuensi tindakannya. Lebih jauh, ada hal-hal yang seorang fisikawan dapat menjadi cerdas tentang bahwa seorang anak tidak bisa: seorang fisikawan dapat, misalnya, memutuskan untuk memikirkan kembali hukum gerak Newton dan datang dengan relativitas umum.2

Contoh saya menunjukkan pentingnya kemauan, kemauan. AI dapat memainkan Chess or Go, mengalahkan manusia tingkat kejuaraan, tetapi AI tidak dapat memutuskan ingin bermain Chess or Go. Ini adalah bahan yang hilang dalam eksperimen pemikiran Ruang Cina Searls. Searls membayangkan seseorang di sebuah ruangan dengan kotak-kotak simbol Cina dan algoritma untuk menerjemahkan bahasa Cina. Orang-orang di luar ruangan memberikan pertanyaan yang ditulis dalam bahasa Cina, dan orang di dalam ruangan menggunakan kotak simbol (database) dan algoritma untuk menyiapkan jawaban yang benar. Bisakah kita mengatakan bahwa orang itu “mengerti” bahasa Mandarin? Pertanyaan penting di sini bukanlah apakah orang tersebut tidak dapat dibedakan dari komputer yang mengikuti algoritma yang sama. Apa yang mengejutkan saya adalah bahwa baik komputer, maupun manusia, tidak mampu memutuskan untuk melakukan percakapan dalam bahasa Cina. Mereka hanya menanggapi masukan, dan tidak pernah menunjukkan kemauan apa pun. (Demonstrasi kemauan yang sama meyakinkannya adalah komputer, atau manusia, yang mampu menghasilkan bahasa Mandarin dengan benar menolak untuk terlibat dalam percakapan.) Ada banyak demonstrasi (termasuk Agüera y Arcas’) dari LLM yang memiliki “percakapan” yang menarik dengan manusia, tetapi tidak ada komputer yang memulai percakapan, atau menunjukkan bahwa ia ingin melakukan percakapan. Manusia melakukannya; kami telah menjadi pendongeng sejak hari pertama, kapan pun itu. Kami telah menjadi pendongeng, pengguna ambiguitas, dan pembohong. Kami bercerita karena kami ingin.

Itu adalah elemen kritis. Kecerdasan terhubung dengan kemauan, kemauan, keinginan untuk melakukan sesuatu. Di mana Anda memiliki “keinginan untuk melakukan”, Anda juga memiliki “keinginan untuk tidak melakukan”: kemampuan untuk tidak setuju, tidak patuh, untuk melanggar. Sama sekali tidak mengejutkan bahwa kiasan “pengendalian pikiran” adalah salah satu yang paling menakutkan dalam fiksi ilmiah dan propaganda politik: itu adalah tantangan langsung terhadap apa yang kita lihat sebagai manusia pada dasarnya. Juga tidak mengherankan bahwa “komputer yang tidak patuh” adalah salah satu dari kiasan menakutkan itu, bukan karena komputer dapat mengalahkan kita, tetapi karena dengan tidak patuh, ia telah menjadi manusia.

Saya tidak selalu melihat ketiadaan kemauan sebagai batasan mendasar. Saya pasti tidak akan bertaruh bahwa tidak mungkin untuk memprogram sesuatu yang mensimulasikan kemauan, jika bukan kemauan itu sendiri (lain dari istilah-istilah yang secara fundamental ambigu). Apakah insinyur dan peneliti AI harus adalah pertanyaan yang berbeda. Memahami kemauan sebagai komponen kunci dari “kecerdasan”, sesuatu yang model kami saat ini tidak mampu, berarti bahwa diskusi kami tentang “AI etis” tidak benar-benar tentang AI; mereka tentang pilihan yang dibuat oleh peneliti dan pengembang AI. Etika adalah untuk makhluk yang dapat membuat pilihan. Jika kemampuan untuk melanggar merupakan komponen kunci dari kecerdasan, para peneliti perlu memilih apakah akan menganggap serius kiasan “komputer yang tidak patuh”. Saya telah mengatakan di tempat lain bahwa saya tidak khawatir tentang apakah kecerdasan umum buatan hipotetis mungkin memutuskan untuk membunuh semua manusia. Manusia telah memutuskan untuk melakukan genosida pada banyak kesempatan, sesuatu yang saya yakini tidak akan dianggap logis oleh AGI. Tapi komputer di mana “kecerdasan” menggabungkan kemampuan manusia untuk berperilaku transgresif mungkin.

Dan itu membawa saya kembali ke awal yang canggung untuk artikel ini. Memang, saya belum banyak menulis tentang AI baru-baru ini. Itu adalah pilihan, seperti menulis artikel ini. Bisakah LLM menulis ini? Mungkin, dengan petunjuk yang tepat untuk mengaturnya ke arah yang benar. (Ini persis seperti Ruang Cina.) Tapi saya memilih untuk menulis artikel ini. Tindakan memilih itu adalah sesuatu yang tidak pernah bisa dilakukan oleh LLM, setidaknya dengan teknologi kita saat ini.


Catatan kaki

  1. Saya tidak pernah begitu terkesan dengan gagasan kecerdasan yang diwujudkan—bahwa kecerdasan membutuhkan konteks tubuh dan masukan sensorik. Namun, argumen saya di sini menunjukkan bahwa itu mengarah pada sesuatu, dengan cara yang belum saya sebutkan. “Duduk” tidak ada artinya tanpa tubuh. Fisika tidak mungkin tanpa pengamatan. Stres merupakan reaksi yang membutuhkan tubuh. Namun, Blaise Agüera y Arcas telah “bercakap-cakap” dengan model Google di mana mereka berbicara tentang “pulau favorit” dan mengklaim memiliki “indera penciuman.” Apakah ini pelanggaran? Apakah itu imajinasi? Apakah “perwujudan” merupakan konstruksi sosial, bukan konstruksi fisik? Ada banyak ambiguitas di sini, dan itulah mengapa itu penting. Apakah pelanggaran mungkin terjadi tanpa tubuh?
  2. Saya ingin menjauh dari teori kemajuan “orang hebat”; seperti yang dikatakan Ethan Siegel dengan meyakinkan, jika Einstein tidak pernah hidup, fisikawan mungkin akan membuat terobosan Einstein dalam waktu yang relatif singkat. Mereka berada di ambang, dan beberapa berpikir di jalur yang sama. Ini tidak mengubah argumen saya, meskipun: untuk datang dengan relativitas umum, Anda harus menyadari bahwa ada sesuatu yang salah dengan fisika Newton, sesuatu yang kebanyakan orang anggap “hukum,” dan persetujuan belaka bukanlah jalan ke depan. Baik kita berbicara tentang anjing, anak-anak, atau fisikawan, kecerdasan bersifat transgresif.



Artikel ini telah tayang pertama kali di situs www.oreilly.com

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button