<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://lms.onnocenter.or.id/wiki/index.php?action=history&amp;feed=atom&amp;title=Dataset_Stratifikasi_Data</id>
	<title>Dataset Stratifikasi Data - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://lms.onnocenter.or.id/wiki/index.php?action=history&amp;feed=atom&amp;title=Dataset_Stratifikasi_Data"/>
	<link rel="alternate" type="text/html" href="https://lms.onnocenter.or.id/wiki/index.php?title=Dataset_Stratifikasi_Data&amp;action=history"/>
	<updated>2026-04-25T23:30:55Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.45.1</generator>
	<entry>
		<id>https://lms.onnocenter.or.id/wiki/index.php?title=Dataset_Stratifikasi_Data&amp;diff=72253&amp;oldid=prev</id>
		<title>Unknown user: Created page with &quot;Untuk memastikan pembagian dataset secara &#039;&#039;&#039;stratifikasi&#039;&#039;&#039; dalam Python, Anda dapat menggunakan fungsi `train_test_split` dari pustaka &#039;&#039;&#039;scikit-learn&#039;&#039;&#039;. Stratifikasi memas...&quot;</title>
		<link rel="alternate" type="text/html" href="https://lms.onnocenter.or.id/wiki/index.php?title=Dataset_Stratifikasi_Data&amp;diff=72253&amp;oldid=prev"/>
		<updated>2025-04-01T01:21:40Z</updated>

		<summary type="html">&lt;p&gt;Created page with &amp;quot;Untuk memastikan pembagian dataset secara &amp;#039;&amp;#039;&amp;#039;stratifikasi&amp;#039;&amp;#039;&amp;#039; dalam Python, Anda dapat menggunakan fungsi `train_test_split` dari pustaka &amp;#039;&amp;#039;&amp;#039;scikit-learn&amp;#039;&amp;#039;&amp;#039;. Stratifikasi memas...&amp;quot;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Untuk memastikan pembagian dataset secara &amp;#039;&amp;#039;&amp;#039;stratifikasi&amp;#039;&amp;#039;&amp;#039; dalam Python, Anda dapat menggunakan fungsi `train_test_split` dari pustaka &amp;#039;&amp;#039;&amp;#039;scikit-learn&amp;#039;&amp;#039;&amp;#039;. Stratifikasi memastikan bahwa proporsi kelas dalam subset data (misalnya, data pelatihan dan pengujian) mencerminkan proporsi kelas dalam dataset asli. Hal ini sangat penting ketika bekerja dengan dataset yang memiliki distribusi kelas yang tidak seimbang.&lt;br /&gt;
&lt;br /&gt;
Berikut adalah contoh kode Python yang menunjukkan cara melakukan pembagian dataset dengan stratifikasi:&lt;br /&gt;
&lt;br /&gt;
 from sklearn.model_selection import train_test_split&lt;br /&gt;
 import pandas as pd&lt;br /&gt;
 &lt;br /&gt;
 # Contoh: Membuat DataFrame dengan fitur &amp;#039;X&amp;#039; dan target &amp;#039;y&amp;#039;&lt;br /&gt;
 data = {&lt;br /&gt;
     &amp;#039;X1&amp;#039;: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],&lt;br /&gt;
     &amp;#039;X2&amp;#039;: [11, 12, 13, 14, 15, 16, 17, 18, 19, 20],&lt;br /&gt;
     &amp;#039;y&amp;#039;:  [0, 1, 0, 1, 0, 1, 0, 1, 0, 1]  # Target dengan dua kelas seimbang&lt;br /&gt;
 }&lt;br /&gt;
 &lt;br /&gt;
 df = pd.DataFrame(data)&lt;br /&gt;
 &lt;br /&gt;
 # Memisahkan fitur dan target&lt;br /&gt;
 X = df[[&amp;#039;X1&amp;#039;, &amp;#039;X2&amp;#039;]]&lt;br /&gt;
 y = df[&amp;#039;y&amp;#039;]&lt;br /&gt;
 &lt;br /&gt;
 # Membagi dataset menjadi data pelatihan dan pengujian dengan stratifikasi&lt;br /&gt;
 X_train, X_test, y_train, y_test = train_test_split(&lt;br /&gt;
     X, y, test_size=0.3, stratify=y, random_state=42&lt;br /&gt;
 )&lt;br /&gt;
 &lt;br /&gt;
 # Menampilkan proporsi kelas di setiap subset&lt;br /&gt;
 print(&amp;quot;Proporsi kelas di y_train:\n&amp;quot;, y_train.value_counts(normalize=True))&lt;br /&gt;
 print(&amp;quot;\nProporsi kelas di y_test:\n&amp;quot;, y_test.value_counts(normalize=True))&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Penjelasan kode:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
&lt;br /&gt;
1. &amp;#039;&amp;#039;&amp;#039;Import Library:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* `train_test_split` dari `sklearn.model_selection` untuk membagi dataset.&lt;br /&gt;
* `pandas` untuk manipulasi data dalam bentuk DataFrame.&lt;br /&gt;
&lt;br /&gt;
2. &amp;#039;&amp;#039;&amp;#039;Pembuatan DataFrame:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Dataset contoh dibuat dengan dua fitur (`X1`, `X2`) dan satu target (`y`) yang memiliki dua kelas seimbang.&lt;br /&gt;
&lt;br /&gt;
3. &amp;#039;&amp;#039;&amp;#039;Pemilahan Fitur dan Target:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* `X` berisi fitur-fitur, sedangkan `y` berisi target.&lt;br /&gt;
&lt;br /&gt;
4. &amp;#039;&amp;#039;&amp;#039;Pembagian Dataset dengan Stratifikasi:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Menggunakan `train_test_split` dengan parameter `stratify=y` untuk memastikan distribusi kelas pada `y_train` dan `y_test` sama dengan distribusi pada `y` asli.&lt;br /&gt;
* `test_size=0.3` menunjukkan 30% data dialokasikan untuk pengujian, dan 70% untuk pelatihan.&lt;br /&gt;
* `random_state=42` memastikan hasil pembagian yang konsisten setiap kali kode dijalankan.&lt;br /&gt;
&lt;br /&gt;
5. &amp;#039;&amp;#039;&amp;#039;Verifikasi Proporsi Kelas:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* `value_counts(normalize=True)` digunakan untuk menampilkan proporsi setiap kelas dalam `y_train` dan `y_test`.&lt;br /&gt;
&lt;br /&gt;
Dengan menggunakan stratifikasi, Anda memastikan bahwa setiap subset data memiliki distribusi kelas yang serupa dengan dataset asli, yang penting untuk menghindari bias dalam pelatihan dan evaluasi model.&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Catatan:&amp;#039;&amp;#039;&amp;#039; Jika Anda memiliki lebih dari satu fitur kategori yang ingin digunakan untuk stratifikasi, Anda dapat menggabungkan kolom-kolom tersebut sebelum menerapkannya pada parameter `stratify`. Namun, perlu diperhatikan bahwa stratifikasi berdasarkan beberapa kolom dapat menjadi kompleks dan memerlukan penanganan khusus, terutama jika terdapat kombinasi kategori yang jarang muncul.&lt;br /&gt;
&lt;br /&gt;
Untuk pemahaman lebih lanjut tentang stratifikasi dalam pembagian dataset, Anda dapat merujuk ke dokumentasi resmi scikit-learn. &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Pranala Menarik==&lt;br /&gt;
&lt;br /&gt;
* [[Orange]]&lt;/div&gt;</summary>
		<author><name>Unknown user</name></author>
	</entry>
</feed>