Pendidikan:, Ilmu Pengetahuan
Bidang subjek penelitian
Setiap penelitian terdiri dari pengamatan sifat benda untuk menjelaskan dan mengevaluasi hubungan dan hubungan yang signifikan antara indikator sifat-sifat ini.
Bidang subjek mencakup objek yang berbeda dalam sifat dan dalam beberapa hal dalam beberapa hal saling berhubungan. Memecahkan masalah dalam pemrograman dimulai dengan mempelajari bidang subjek.
Bidang subjek adalah bagian dari dunia nyata, yang tak terbatas dan berisi data penting dan tidak penting. Peneliti harus dapat mengalokasikan bagian penting mereka. Misalnya, saat memecahkan masalah pemberian pinjaman, semua data tentang kehidupan pribadi klien (apakah karya pasangan, apakah klien membesarkan anak kecil, pendidikan klien, dll.) Akan dianggap signifikan. Dan untuk menyelesaikan tugas lain yang berkaitan dengan perbankan, data semacam itu sama sekali tidak relevan. Pentingnya data tergantung pada apa yang kita pilih sebagai area subjek.
Dalam proses penelitian itu diperlukan untuk membuat model domain. Pengetahuan dari sumber yang berbeda harus diformalkan. Bidang subjek diformalkan dengan cara apapun . Berarti bisa sangat berbeda. Ini bisa menjadi deskripsi tekstual dari domain atau notasi grafis khusus. Dengan bantuan model domain, proses yang terjadi di dalamnya dijelaskan, dan juga data dari bidang studi ini dipelajari.
Perumusan masalah juga terdiri dari menggambarkan perilaku statis dan dinamis dari objek yang sedang kita jelajahi. Deskripsi perilaku statis melibatkan karakterisasi objek dan propertinya. Dalam menggambarkan perilaku dinamis, penyebab perilaku objek dicirikan.
Perilaku dinamis objek sering digambarkan bersamaan dengan perilaku statis.
Terkadang analisis bidang subjek dan pernyataan masalah digabungkan menjadi satu tahap.
Pada tahap definisi dan analisis kebutuhan data, data yang diperlukan untuk pelaksanaan Data Mining dimodelkan. Untuk tujuan ini, isu distribusi pengguna dieksplorasi; Karakteristik analitis dari sistem; Pertanyaan akses terhadap data yang diperlukan untuk analisis.
Area subjek dianalisis lebih mudah dan lebih efisien bila organisasi memiliki gudang data. Namun, tidak semua perusahaan memiliki gudang data tersebut. Dalam hal ini, sumber untuk data awal adalah database operasional, referensi dan bahan arsip, yaitu data dari sistem informasi yang ada (sistem informasi).
Ini mungkin juga memerlukan informasi dari para manajer, sumber eksternal dan internal, berbagai dokumen tentang pembawa kertas, serta pengetahuan tentang spesialis dan / atau hasil survei.
Perlu juga diketahui bahwa selama penyusunan data, pengembang program harus mendeskripsikan sebanyak mungkin faktor yang mempengaruhi proses. Beberapa data bisa dikodekan di sini. Misalnya, salah satu karakteristik klien adalah tingkat pendapatannya, yang dapat didefinisikan sebagai: sangat rendah, rendah, menengah, tinggi, sangat tinggi. Dalam hal ini, Anda perlu menentukan tingkat kelulusan pendapatan.
Saat menentukan jumlah data yang benar, pertimbangan harus diberikan pada pemesanan data.
Bila dipesan, perlu diketahui apakah komponen musiman / siklik disertakan dalam kumpulan data tersebut. Saat mereka tidak memesan, mis. Kumpulan kejadian dari database tidak terkait dengan timeline, maka selama pengumpulan, peraturan berikut harus diperhatikan:
1) sejumlah kecil catatan dalam database dapat menjadi alasan untuk menciptakan model yang tidak memadai;
2) keakuratan model dapat ditingkatkan dengan meningkatnya jumlah data;
3) data usang dikeluarkan dari himpunan;
4) Algoritma yang digunakan untuk membuat model menggunakan database yang sangat besar harus terukur.
Similar articles
Trending Now