Banyak istilah yang penting dalam bidang ilmu Artificial Intelligence (AI) dan Machine Learning (Pembelajaran Mesin) sehingga maknanya perlu dipahami para pembelajar.
Istilah-istlah tersebut di antaranya akan ditampilkan dan sedikit dibahas dalam artikel ini. Namun sebelumnya akan disampaikan lebih dahulu hubungan antara AI dan Machine Learning.
A. Hubungan antara AI dan Machine Learning
Disarikan dari [1], sebagai suatu ilmu AI baru berkembang setelah tahun 1950-an. Istilah AI sendiri dimunculkan dalam konferensi Darthmouth, di New Hampshire AS pada tahun 1956 yang dihadiri oleh para ilmuwan.
James McCarthy seorang akademisi dari Stanford University mendefinisikan AI sebagai ilmu dan rekayasa untuk membuat mesin menjadi cerdas (terutama program komputer yang cerdas).
Dalam perkembangannya, AI kemudian menjadi ilmu yang interdisipliner. Terdapat dua (2) pendekatan utama dalam AI, yaitu:
a. Pendekatan dimana mesin mengalami proses belajar untuk melakukan suatu tugas tertentu. Inilah yang kemudian dikenal sebagai ilmu Machine Learning (pembelajaran mesin). Jadi Machine Learning tidak lain adalah bagian dari AI yang menggunakan pendekatan proses belajar atas data.
b. Pendekatan dimana mesin tidak membutuhkan proses belajar. Yang termasuk dalam pendekatan ini dipelajari dalam ilmu Sistem Pakar (Expert System), Pemrosesan Bahasa Alami (Natural Language Processing), Logika Simbolis (Symbolic Logic), Mesin Aturan (Rules Engine), dan Grafik Pengetahuan (Knowledge Graphs). Dengan demikian ilmu-ilmu tersebut juga termasuk ke dalam wilayah AI.
B. Istilah-istilah Penting dalam AI
Disarikan dari [2] maka berikut ini sejumlah istilah penting yang perlu diketahui dalam bidang AI:
- AI Auditing
Evaluasi dan monitoring sistem AI agar memenuhi kriteria: kesesuaian (compliance), keselamatan dan etika.
- AI Accountability
Membangun mekanisme yang akan memastikan pengembang maupun pengguna akan bertanggung jawab atas dampak dari sistem AI yang mereka bangun atau mereka gunakan.
- AI Allignment
Mengembangkan sistem AI yang tujuan maupun perilakunya sejalan dengan nilai-nilai manusia dan maksud penggunaannya.
- AI Benchmarking
Membangun cara pengetesan dan metrik standar untuk membandingkan dan mengevaluasi berbagai macam sistem AI.
- AI Bias Mitigation
Teknik dan metode untuk mengidentifikasi serta mengurangi bias dalam sistem AI, sehingga terwujud keluaran yang adil (fair) dan sejajar (equitable).
- AI Certification
Proses maupun standar yang dipakai dalam sertifikasi aspek-aspek keamanan, kehandalan dan kesesuaian sistem AI.
- AI Capacity Building
Pengembangan keterampilan dan pengetahuan yang dibutuhkan untuk menciptakan dan mengelola sistem AI.
- AI Compliance
Penjaminan sistem AI agar sesuai dengan aturan perundangan yang relevan maupun standar-standar yang ada di industri.
- AI Control Systems
Mekanisme yang didesain untuk mengontrol perilaku maupun tindakan dari sistem AI.
- AI Ethics Framework
Seperangkat panduan agar pertimbangan etika juga terintegrasi ke dalam pengembangan dan implementasi sistem AI.
- AI Ethics Education
Pengajaran mengenai prinsip dan kerangka etika dalam pengembangan maupun penggunaan yang bertanggung jawab atas sistem AI.
- AI Ethics Training
Pendidikan atas seseorang mengenai pertimbangan etika dan dampak potensial dari sistem AI.
- AI Ethics Board
Sekumpulan ahli yang mengawasi implikasi etis atas proyek dan implementasi sistem AI.
- AI Ethics
Studi dan aplikasi prinsip-prinsip etis dan nilai dalam pengembangan dan penggunaan sistem AI.
- AI Explainability
Pengembangan sistem AI yang bisa menjelaskan proses pengambilan keputusan dan keluaran dari sistem AI.
- AI Literacy
Pendidikan dan pelatihan untuk meningkatkan pemahaman publik atas teknologi AI dan implikasinya.
- Responsible AI
Pembuatan sistem AI yang mengadopsi standar etika dan tanggung jawab sosial.
- Ethical AI
Pengembangan sistem AI yang mengadopsi prinsip-prinsip dan nilai-nilai etika.
- Trustworthy AI
Sistem AI yang dapat diandalkan, transparan dan sejalan dengan nilai-nilai kemanusiaan dan norma masyarakat.
- MLOps/AIOps
Praktek dan alat untuk mengimplementasikan, memonitor dan mempertahankan model machine learning dan model AI dalam lingkungan produksi.
- Cognitive Computing
Penggunaan AI untuk melakukan simulasi proses berpikir manusia dalam memecahkan masalah yang kompleks dan dalam pengambilan keputusan.
- Robust AI
Desain sistem AI agar dapat bekerja dengan handal dan aman di bawah berbagai macam kondisi.
- Human-centric AI
Desain sistem AI yang memberi prioritas bagi kebutuhan, nilai dan pengalaman manusia.
- Explainable AI
Sistem AI yang logika dan keluarannya dapat memberikan penjelasan yang dapat dimengerti manusia
- Human in the Loop
Keterlibatan akan kegagalan yang tidak disengaja oleh manusia maupun intervensinya dalam proses yang melibatkan AI.
- Human Augmentation
Teknologi yang dapat meningkatkan kemampuan kognitif, fisik maupun sensorik manusia.
- Augmented Intelligence
Peningkatan kemampuan manusia melalui penggunaan AI dan bukan untuk menggantikan peran manusia.
- Decision Intelligence
Penggunaan teknologi, termasuk AI, untuk melengkapi dan memperbaiki proses pengambilan keputusan oleh manusia, termasuk menggunakannya secara otomatis untuk mendesain dan mengontrol AI.
C. Istilah-istilah Penting dalam Machine Learning
Machine learning didefinisikan sebagai aplikasi komputer dan algoritma matematika yang diadopsi dengan cara pembelajaran yang berasal dari data dan bisa menampilkan prediksi di masa depan [3].
Di bawah ini adalah sejumlah istilah penting yang perlu diketahui dalam bidang Machine Learning [3].
Pada artikel ini hanya ditunjukkan istilah-istilah yang termasuk dalam pembahasan Algoritma Machine Learning dan Model Machine Learning
C.1. Istilah-istilah dalam Algoritma Machine Learning
- Algoritma machine learning
Aturan atau prosedur yang digunakan oleh model machine learning untuk belajar dari data. Misalnya, memprediksi harga rumah berdasarkan fitur seperti luas tanah, jumlah kamar, dan lokasi.
- Regresi Linier
Algoritma machine learning untuk memodelkan hubungan antara variabel input (fitur) dan variabel target (output) yang bersifat kontinu. Misalnya, memprediksi apakah email adalah spam atau bukan.
- Regresi Logistik
Algoritma machine learning yang digunakan untuk masalah klasifikasi biner, di mana variabel target memiliki hanya dua kelas.
- K-Nearest Neighbors (KNN)
Algoritma machine learning yang sederhana dan intuitif, yang digunakan untuk klasifikasi dan regresi. Untuk klasifikasi, algoritma ini memprediksi kelas suatu data berdasarkan mayoritas kelas dari K tetangga terdekatnya.
- Decision Trees
Algoritma yang memisahkan data menjadi subset yang lebih kecil berdasarkan fitur-fitur tertentu dengan tujuan untuk meminimalkan ketidakpastian dalam klasifikasi atau regresi.
- Random Forest
Algoritma kombinasi dari beberapa pohon keputusan (decision trees) yang digunakan untuk meningkatkan kinerja dan mengurangi overfitting. Setiap pohon dalam hutan dipelajari dari subset acak data.
- Naive Bayes
Algoritma klasifikasi probabilistik yang didasarkan pada Teorema Bayes dengan asumsi independensi antara fitur-fitur. Cocok untuk klasifikasi teks dan data dengan banyak fitur.
- Support Vector Machines (SVM)
Algoritma yang mencari hyperplane terbaik untuk memisahkan data ke dalam kelas-kelas yang berbeda. Cocok untuk klasifikasi dan regresi.
- K-Means Clustering
Algoritma clustering yang membagi data menjadi kelompok-kelompok yang homogen berdasarkan kemiripan fitur. Cocok untuk analisis data tanpa supervisi.
- Principal Component Analysis (PCA)
Algoritma reduksi dimensi yang digunakan untuk mengurangi jumlah fitur dalam data dengan mempertahankan sebagian besar varians.
- Deep Learning
Sekumpulan algoritma machine learning yang menggunakan jaringan saraf tiruan dengan banyak lapisan untuk memodelkan dan memahami data yang kompleks. Termasuk di dalamnya Convolutional Neural Networks (CNNs) untuk data gambar, Recurrent Neural Networks (RNNs) untuk data berurutan seperti teks dan audio, dan banyak lagi.
C.2. Istilah-istilah dalam Model Machine Learning
- Model machine learning
Representasi matematis dari pola yang ditemukan dalam data melalui proses pembelajaran oleh algoritma machine learning.
- Regresi Linier
Model yang digunakan untuk memodelkan hubungan linier antara variabel input dan variabel target yang bersifat kontinu. Ini cocok untuk memprediksi nilai numerik seperti harga, suhu, atau penjualan berdasarkan fitur-fitur tertentu.
- Regresi Logistik
Model yang digunakan untuk masalah klasifikasi biner, di mana variabel target memiliki dua kelas. Ini cocok untuk memprediksi probabilitas keanggotaan dalam kelas tertentu.
- Decision Trees
Model yang memecah data menjadi serangkaian keputusan dan konsekuensi yang diambil berdasarkan fitur-fitur data. Ini bisa digunakan untuk klasifikasi atau regresi.
- Random Forest
Kumpulan dari beberapa pohon keputusan yang digunakan untuk meningkatkan kinerja dan mengurangi overfitting. Setiap pohon dalam hutan dipelajari dari subset acak data.
- Support Vector Machines (SVM)
Model yang mencari hyperplane terbaik untuk memisahkan data ke dalam kelas-kelas yang berbeda. Ini cocok untuk klasifikasi dan regresi.
- Naive Bayes
Model klasifikasi probabilistik yang didasarkan pada Teorema Bayes dengan asumsi independensi antara fitur-fitur. Ini cocok untuk klasifikasi teks dan data dengan banyak fitur.
- Neural Networks
Model yang terdiri dari lapisan-lapisan neuron atau unit pemrosesan yang digunakan untuk memodelkan dan memahami data yang kompleks. Termasuk di dalamnya Convolutional Neural
Networks (CNNs) untuk data gambar, Recurrent Neural Networks
(RNNs) untuk data berurutan seperti teks dan audio, dan banyak lagi.
- K-Means Clustering
Model yang digunakan untuk mengelompokkan data ke dalam kelompok-kelompok yang homogen berdasarkan kemiripan fitur. Ini cocok untuk analisis data tanpa supervisi.
C.3. Istilah-istilah Penting dalam Pelatihan Machine Learning
- Overfitting
Masalah dalam pelatihan yang terjadi ketika model terlalu rumit dan belajar pola yang terlalu spesifik dari data pelatihan, sehingga gagal dalam menggeneralisasi pola ke data baru yang belum terlihat sebelumnya.
- Underfitting
Masalah dalam pelatihan yang terjadi ketika model terlalu sederhana dan tidak dapat menangkap pola yang kompleks dalam data pelatihan. Hal ini dapat terlihat ketika kinerja model pada data pelatihan dan data validasi keduanya rendah.
C.4. Istilah-istilah Penting dalam Validasi Machine Learning
- Validasi machine learning
Proses evaluasi kinerja model pada data yang tidak digunakan selama pelatihan. Dari sini dapat terukur seberapa baik model tersebut menggeneralisasi pola yang telah dipelajari dari data pelatihan ke data baru yang belum pernah digunakan sebelumnya.
- Validasi Holdout
Teknik validasi yang paling sederhana di mana data dibagi menjadi dua subset: data pelatihan dan data pengujian. Model dilatih menggunakan data pelatihan dan dievaluasi menggunakan data pengujian.
- Validasi Silang (Cross-Validation) Teknik ini lebih handal daripada validasi holdout, terutama ketika data terbatas. Data dibagi menjadi
beberapa subset (lipatan), dan model dilatih dan diuji menggunakan setiap lipatan secara bergantian.
- Validasi Silang Berulang (Repeated Cross-Validation)
Teknik ini adalah perluasan dari validasi silang di mana proses validasi silang diulang beberapa kali dengan pembagian data yang berbeda setiap kali.
- Validasi Silang Terbagi (Stratified Cross-Validation)
Teknik ini cocok untuk masalah klasifikasi di mana kelas target tidak seimbang. Data dibagi menjadi lipatan sedemikian rupa sehingga distribusi kelas dalam setiap lipatan mirip dengan distribusi kelas dalam data keseluruhan.
- Leave-One-Out Cross-Validation (LOOCV)
Teknik validasi ini melibatkan pengujian model pada setiap sampel data secara terpisah dengan menggunakan seluruh data, kecuali satu sampel sebagai data pelatihan.
C.5. Istilah-istilah Penting dalam Evaluasi Machine Learning
- Evaluasi dalam machine learning Proses untuk mengukur kinerja model berdasarkan kemampuannya untuk membuat prediksi atau keputusan yang akurat dan berguna.
- Akurasi (Accuracy)
Persentase prediksi yang benar dari total prediksi yang dilakukan oleh model.
- Presisi (Precision)
Persentase prediksi positif yang benar dari total prediksi positif yang dilakukan oleh model. Hal ini berguna ketika kita ingin meminimalkan jumlah false positive.
- Recall (Sensitivitas)
Persentase instance positif yang benar yang berhasil diidentifikasi oleh model dari total instance positif yang ada. Ini berguna ketika kita ingin meminimalkan jumlah false negative.
- F1-Score
Harmonic mean dari presisi dan recall, yang memberikan gambaran yang seimbang antara keduanya. Hal ini berguna ketika ada ketidakseimbangan antara kelas-kelas yang ada.
- Confusion Matrix
Tabel yang menggambarkan kinerja model dengan membandingkan prediksi kelas dengan kelas yang sebenarnya. Tabel ini menyajikan jumlah True Positive (TP), False Positive (FP), True Negative (TN), dan False Negative (FN).
Penjelasan lebih lengkapnya mengenai istilah-istilah dalam machine learning di atas dapat pembaca unduh dan baca referensi [3] di bawah ini.
Referensi:
[1]. Nopriadi. Artificial Intelligence. in Haryanti, S (ed). ChatGPT untuk Pendidikan: Literasi Artificial Intelligence untuk Guru dan Dosen. CV Media Sains Indonesia, Bandung. 2023.
[2]. Kozyrkov, C. Glossary of AI Control Terms. Linkedin, 2024.
[3] Alimuddin dan Arafiyah, R. Konsep Machine Learning. In Hapsari, N (ed). Transformasi Digital Pengantar Literasi Digital untuk Mahasiswa. Seval Literindo Kreasi, Lombok Barat. 2024
I rеally like reading through an aгticle that can make men and women thіnk.
Also, thanks for allowing for me to comment!
Tinggalkan Komentar