Evaluasi kinerja metode clara dan fcm dalam analisis gerombol untuk data berjumlah besar dengan pencilan. Evaluasi kinerja CLARA & FCM dalam analisis gerombol data besar dengan pencilan. Temukan bagaimana faktor pencilan & jumlah data mempengaruhi akurasi, serta efektivitas FCM pada variasi data.
Analisis gerombol adalah suatu metode statistika yang mengidentifikasi gerombol objek berdasarkan karakteristik serupa. Masalah yang sering terjadi dalam analisis gerombol adalah keberadaan data pencilan. Keberadaan pencilan dapat mengakibatkan output yang tidak sesuai dengan gambaran yang sebenarnya, sehingga gerombol yang dihasilkan tidak merepresentasikan objek dengan tepat. Masalah lain yang dapat muncul dalam analisis gerombol adalah besarnya jumlah amatan, sehingga diperlukan metode analisis yang efisien dalam penggerombolan. Penelitian ini juga memperdalam tentang kinerja keduanya terhadap jarak antara pusat gerombol dan kondisi penggerombolan melalui kajian simulasi, dimana masing-masing faktor terdiri dari tiga level yang diobservasi.Metode Clustering Large Applications (CLARA) dan Fuzzy C-Means (FCM) adalah metode yang kekar terhadap pencilan dan mampu menganalisis dataset besar. Metode FCM menggunakan nilai pembobot (w) yang optimal untuk mencapai kekar terhadap pencilan. Metode CLARA memiliki sifat kekar dikarenakan menggunakan medoid sebagai pusat gerombol dan penggunaan jarak Manhattan dalam perhitungan jarak antara objek dan pusat gerombol. Metode tersebut akan dievaluasi menggunakan beberapa kriteria evaluasi kebaikan yaitu berdasarkan rasio simpangan baku dalam gerombol dan antar gerombol. Hasil analisis menunjukkan pengaruh signifikan pada masing-masing faktor dan interaksi antar faktor. Visualisasi menunjukkan bahwa peningkatan persentase pencilan mengurangi akurasi penggerombolan, sementara jumlah data yang lebih besar meningkatkan akurasi. Jarak yang lebih besar antara pusat gerombol dan kondisi gerombol yang terpisah menghasilkan rasio simpangan baku gerombol yang lebih kecil. Hasil penelitian menunjukkan bahwa metode FCM lebih efektif dalam menangani data dengan variasi yang signifikan.
This study provides a timely evaluation of the performance of Clustering Large Applications (CLARA) and Fuzzy C-Means (FCM) methods for cluster analysis, specifically addressing the critical challenges posed by large datasets and the presence of outliers. The abstract clearly articulates the problem: outliers can distort clustering outcomes, leading to inaccurate representations, while the sheer volume of data demands efficient analytical methods. By focusing on CLARA and FCM, the research aims to assess methods purported to be robust against outliers and capable of handling extensive datasets, thereby contributing to the development of more reliable clustering techniques in practical applications. The methodology centers around a simulation study designed to systematically investigate the performance of CLARA and FCM under varying conditions. The research specifically explores the impact of factors such as the distance between cluster centers and different clustering conditions, each observed at three distinct levels. The abstract highlights the unique mechanisms through which each method achieves robustness: CLARA's reliance on medoids and Manhattan distance, and FCM's use of an optimal weighting value (w). Evaluation criteria are robustly defined using the ratio of within-cluster to between-cluster standard deviations, providing a quantitative measure of cluster quality and separation. The findings reveal significant influences from both individual factors and their interactions on clustering performance. Notably, the study confirms that an increase in outlier percentage detrimentally affects clustering accuracy, while, counter-intuitively, larger data volumes appear to enhance accuracy. Furthermore, greater distances between cluster centers and more separated clustering conditions contribute to a smaller (and thus better) ratio of within-cluster standard deviations. The key conclusion posits that the FCM method demonstrates superior effectiveness, particularly when dealing with data exhibiting significant internal variation, offering valuable insights for practitioners selecting clustering algorithms for complex datasets.
You need to be logged in to view the full text and Download file of this article - Evaluasi Kinerja Metode CLARA dan FCM dalam Analisis Gerombol untuk Data Berjumlah Besar dengan Pencilan from Limits: Journal of Mathematics and Its Applications .
Login to View Full Text And DownloadYou need to be logged in to post a comment.
By Sciaria
By Sciaria
By Sciaria
By Sciaria
By Sciaria
By Sciaria