Ketahui cara pasar raya besar menggunakan perlombongan data untuk mengetahui bahawa penjualan lampin dan bir adalah berkaitan, kemudian menukar campuran produk untuk meningkatkan jualan. Kami menerangkan secara terperinci cara perlombongan data berfungsi, jenis perlombongan data yang berbeza dan perkara yang boleh dilakukan untuk anda. Perlombongan data boleh digunakan dalam banyak bidang, bukan hanya pemasaran, dan akan memainkan peranan yang semakin penting dalam era data besar.
Anda ialah pengurus kedai Kedai A L-Mart, sebuah pasar raya besar. Baru-baru ini, pesaing, H-Mart, telah dibuka berdekatan, dan anda bimbang jualan kedai anda menurun dengan ketara. Anda memutuskan untuk meminta bantuan daripada ibu pejabat. Pekerja yang dihantar oleh ibu pejabat melawat kedai dan meminta anda menghantar sejarah jualan selama tiga bulan. Selepas beberapa hari, dia menyerahkan sehelai kertas kepada anda dengan arahan untuk menukar susunan barang. apa? Bir di sebelah lampin bayi? Bir di sebelah lampin, yang bukan tisu mahupun mainan bayi, tidak masuk akal. Tetapi anda terlalu malu untuk mengadu kepada ibu pejabat, jadi anda memutuskan untuk menyusun semula item seperti yang diarahkan. Sebulan kemudian, apabila anda menyemak jualan anda, anda menyedari bahawa jualan bir telah meningkat secara mendadak, sama seperti pembohongan.
Ini bukan versi rekaan cerita kehidupan sebenar. Pada masa lalu, Walmart di Amerika Syarikat menganalisis data dan mendapati bahawa lampin dan jualan bir adalah berkorelasi, bermakna bapa kepada kanak-kanak sering membeli bir apabila mereka membeli lampin. Mereka dapat mengambil kesempatan daripada ini dengan meletakkan lampin dan bir bersama-sama, menghasilkan peningkatan ketara dalam jualan bir.
Mari kita kembali kepada contoh Stor A. Bagaimanakah kakitangan ibu pejabat menemui korelasi ini? Jawapannya ialah perlombongan data. Perlombongan data ialah proses mengekstrak maklumat berharga daripada sejumlah besar data dengan mengenal pasti sambungan, persamaan, corak dan sebagainya. Data yang kami kumpul setiap hari hanyalah timbunan nombor dengan sendirinya, dan ia perlu "diproses" untuk menjadikannya berharga. Analogi yang ketara untuk ini ialah 'seni sampah'. Seni sampah ialah apabila anda membuat seni daripada sampah atau sampah. Karya seni yang indah dan menakjubkan dihasilkan daripada timbunan sisa tayar, puntung rokok, penutup botol dan sampah lain yang kebanyakan orang tidak akan melihatnya. Artis sampah mengisih dan menggabungkan item ini untuk mencapai warna, tekstur dan kilauan yang mereka cari, dan hasil akhirnya ialah karya seni. Begitu juga, banyak data tidak mempunyai nilai sendiri, tetapi apabila ia diisih dan digabungkan dengan beberapa niat, sesuatu yang berharga tercipta.
Terdapat lima jenis utama perlombongan data: penerangan kelas dan diskriminasi kelas, analisis kelompok, analisis persatuan, analisis terpencil dan analisis corak berjujukan. Apabila satu set data yang dikumpulkan bersama oleh beberapa kriteria dipanggil kelas, mencari ciri-ciri item data yang diberikan dipanggil deskripsi kelas, mencari ciri khas yang boleh membahagikan data kepada dua kumpulan dipanggil stratifikasi, analisis kelompok digunakan. untuk mencari kelas baharu, dan analisis perkaitan digunakan untuk mencari pautan antara kumpulan data. Mencari data yang menyimpang dengan ketara daripada purata dipanggil analisis outlier, dan menganalisis corak tingkah laku dari semasa ke semasa dipanggil analisis corak berjujukan.
Jenis perlombongan data yang digunakan dalam contoh kami ialah analisis persatuan. Dalam analisis persatuan, tiga ukuran digunakan untuk menentukan tahap persatuan. Yang pertama ialah 'sokongan', iaitu peratusan semua transaksi di mana dua item (A dan B) didagangkan bersama. Yang kedua ialah "Keyakinan," iaitu peratusan jumlah transaksi A yang melibatkan A dan B bersama-sama. Yang terakhir ialah 'peningkatan', iaitu peratusan A dan B yang didagangkan bersama (keyakinan) daripada peratusan semua dagangan di mana B didagangkan. Jika peningkatan mempunyai nilai 1, ia adalah bebas antara satu sama lain, dan jika ia lebih besar daripada 1, ia berkorelasi secara positif, dan jika ia kurang daripada 1, ia berkorelasi secara negatif. Pertama, sokongan dikira untuk semua item, dan kemudian keyakinan dikira untuk item yang mempunyai tahap sokongan tertentu. Pelombong data memutuskan tahap sokongan yang sepatutnya, dan kemudian mengira peningkatan untuk item yang dianggap agak berkaitan antara satu sama lain untuk mengetahui bagaimana ia dikaitkan. Ini adalah bagaimana kami mendapati bahawa lampin dan bir adalah berkaitan dan berkorelasi positif.
Walaupun kami hanya membincangkan cara perlombongan data boleh digunakan dalam pemasaran, ia boleh digunakan dalam pelbagai bidang. Dalam kewangan, ia digunakan untuk pemarkahan kredit, pengesanan penipuan kad kredit dan ramalan harga sekuriti; dalam telekomunikasi, ia digunakan untuk pencegahan churn pelanggan, pengecaman watak dan corak, dan pengurusan keselamatan; dalam penjagaan kesihatan, ia digunakan untuk diagnosis penyakit dan analisis genetik; dalam tenaga, ia digunakan untuk ramalan permintaan elektrik dan penerokaan sumber; dan dalam pembuatan, ia digunakan untuk pembangunan produk/perkhidmatan baharu, ramalan kecacatan, automasi kilang, inventori dan pengurusan permintaan. Di samping itu, ia boleh digunakan sebagai cara untuk memahami situasi masa lalu atau sekarang atau meramalkan masa depan daripada data yang diberikan.
Pada masa kini, data besar sangat popular di seluruh dunia. Dengan penggunaan peranti IT di mana-mana, data sentiasa dijana. Menurut satu statistik, pada tahun 2011 sahaja, kira-kira 2 trilion GB data telah dihasilkan dan digunakan di seluruh dunia, dan 28 bilion GB data telah dihasilkan dan digunakan di Korea. Perlombongan data adalah perlu untuk menjadikan data ini berguna dan bukannya dibuang begitu sahaja, dan memandangkan persekitaran hidup berasaskan Internet dijangka terus berkembang pada masa hadapan, kepentingan perlombongan data dijangka akan berkembang dengan lebih banyak lagi.
Perlombongan data boleh digunakan bukan sahaja untuk meningkatkan jualan, tetapi juga untuk mengenal pasti corak pembelian pelanggan, menjalankan pemasaran tersuai, meningkatkan kecekapan pengurusan inventori, dan membangunkan pelbagai strategi untuk memaksimumkan kepuasan pelanggan. Data ialah minyak dunia moden, dan sejauh mana anda melombong dan memprosesnya boleh membuat atau menghancurkan perniagaan anda, itulah sebabnya sangat penting untuk mengenali kepentingan perlombongan data dan memanfaatkannya.