Pada zaman data besar, kami mendapat perkhidmatan yang lebih diperibadikan daripada banyak data, tetapi kami juga menghadapi risiko kebocoran maklumat peribadi dan pencerobohan privasi. Syarikat menggunakan data besar untuk menganalisis corak pengguna dan membangunkan strategi pemasaran, tetapi privasi menjadi semakin penting dalam proses ini. Mencari keseimbangan antara penggunaan komersial dan perlindungan data adalah cabaran utama dalam dunia moden.
“○○, awak akan lambat ke kelas. Cepat pergi sekolah!”
"Ya, saya akan ke sana, saya akan ke sana, saya dalam perjalanan."
Pagi untuk pelajar kolej tidak mudah. Setiap pagi, tidak kira sesibuk mana pun saya, ada satu langkah yang saya tidak pernah skip: memakai solek! Selepas membersihkan muka saya dengan pembersih yang baik, saya menggoncang kulit saya. Beberapa titis keluar, tetapi kemudian ia berhenti. Muka saya kering kerana kekurangan kulit dan cepat menjadi merah. Semasa dia tergesa-gesa keluar dari rumah, dia menerima teks daripada ㅇㅇKosmetik, sebuah syarikat yang pernah dibelinya beberapa kali sebelum ini.
'Jualan istimewa untuk ahli sahaja, potongan 30% produk kulit, hanya untuk dua hari, jangan lepaskan peluang ini~!
Senyuman terukir di wajah ○○. “Wah, baguslah. Jualan hanya apabila saya memerlukannya, woohoo.” Dalam masa tiga minit selepas menerima teks, dia memesan dan membayar kulit pada telefon pintarnya. Adakah benar-benar kebetulan bahawa ○○, yang memerlukan kulit, menerima teks promosi daripada syarikat kosmetik?
Pada abad ke-21, terdapat wang dalam data
Ada yang mencirikan dunia moden sebagai zaman banjir data. Ini kerana kami menjana sejumlah besar data dalam masyarakat tempat kami tinggal. Satu bidang yang telah mendapat perhatian sejak beberapa tahun kebelakangan ini ialah bidang data besar. Data besar merujuk kepada sejumlah besar data yang sukar untuk dikumpulkan, disimpan, diambil dan dianalisis menggunakan kaedah konvensional kerana volum, kekerapan dan format penjanaan data adalah terlalu besar berbanding dengan data konvensional.
Dalam contoh di atas, katakan bukan kebetulan bahawa teks promosi itu datang apabila kulit jatuh, tetapi pemasaran strategik syarikat menggunakan data besar. Petikan apakah yang boleh menjadi bukti kukuh untuk menyokong perkara ini? Jawapannya ialah frasa "dibeli beberapa kali". Jika pengguna membeli kulit dan kemudian membelinya semula setiap Beberapa kali, syarikat boleh menganalisis corak perbelanjaan pengguna dengan maklumat pembelian ini. Data ini boleh digunakan untuk menganalisis corak penggunaan pengguna, dan apabila tiba masanya untuk pengguna membeli semula produk itu semula, syarikat boleh menjalankan pelbagai aktiviti promosi.
Ini bukan sesuatu yang akan berlaku pada masa hadapan, ia sesuatu yang berlaku di sekeliling kita sekarang. Malah, syarikat kad kredit dan kad kesetiaan mempunyai maklumat yang sangat tepat tentang corak perbelanjaan pelanggan mereka melalui sejarah perbelanjaan mereka. Mereka bukan sahaja menggunakan maklumat ini untuk menganalisis corak perbelanjaan pemegang kad mereka, tetapi mereka juga menjualnya kepada pelbagai pengeluar sebagai maklumat pemasaran yang berharga. Bukan hanya maklumat kewangan yang direkodkan. Media sosial, sejarah portal web, rekod perubatan, data lokasi GPS dan banyak lagi sedang direkodkan secara rahsia tanpa pengetahuan kami.
Perlombongan data: mencari permata tersembunyi dalam data besar
Tetapi adakah semua data yang hampir tidak terhingga ini bermakna dan berharga? Jawapannya tidak. Bukan sahaja mustahil untuk menganalisis semua maklumat ini, tetapi adalah sangat tidak cekap untuk menganalisis kesemuanya. Dalam erti kata lain, kita perlu memilih hanya apa yang kita perlukan, menganalisisnya, dan menentukan nilainya, dan ini adalah bidang perlombongan data.
'Perlombongan' ialah perkataan yang bermaksud 'perlombongan', dan perlombongan data bermaksud 'untuk melombong data', jadi anda boleh menganggapnya sebagai medan yang boleh meningkatkan kecekapan analisis data dengan memilih hanya data yang diperlukan daripada sejumlah besar data. Ia memerlukan analisis statistik lanjutan dan teknik pemodelan yang sangat menuntut, dan ia merupakan bidang pengajian dalam kejuruteraan industri.
Bidang perlombongan data masih di peringkat awal di Korea, tetapi saya sangat optimistik tentang masa depannya. Terdapat dua sebab untuk ini: pertama, tanpa perlombongan data, analisis data akan menjadi kurang bermakna dan cekap. Ini bermakna tanpa pemilihan data yang betul, keputusan analisis yang betul adalah mustahil. Sebab kedua ialah perlombongan data ialah teknologi utama untuk pengurusan pelanggan, yang merupakan salah satu aspek perniagaan yang paling penting hari ini.
Data besar, serba boleh
Jelas bahawa data besar telah menjadi topik hangat sejak kebelakangan ini. Aplikasi analisis data besar melalui perlombongan data sangat pelbagai. Salah satu contoh analisis data besar yang paling berjaya ialah "Bas Burung Hantu" Seoul. Ini ialah laluan bas lewat malam yang diwujudkan dengan menganalisis data volum panggilan KT, yang merekodkan lokasi masuk dan keluar pemanggil pada waktu lewat malam, dan data trafik Seoul. Ini adalah contoh analisis data yang sangat tepat untuk mencari laluan yang optimum, menghasilkan kepuasan pengguna yang tinggi.
Pakar meramalkan bahawa data besar akan digunakan dalam pelbagai bidang yang lebih luas pada masa hadapan. Salah satu aplikasi terawal ialah pemasaran peribadi. Ini bermakna sasaran pemasaran akan berubah daripada keseluruhan populasi pengguna atau kumpulan tertentu kepada individu iaitu anjakan paradigma dalam pemasaran itu sendiri. Dalam bidang perubatan, analisis data besar boleh digunakan untuk meramalkan bila pesakit akan jatuh sakit atau untuk merawat penyakit yang tidak boleh diubati. Data besar dijangka dibangunkan dan digunakan dalam bidang lain seperti pertanian, politik, dan pentadbiran. Sesetengah sarjana juga meramalkan bahawa data besar boleh digunakan untuk meramal dan mengatasi bencana alam, yang sebelum ini dianggap di luar kawalan manusia.
Dua muka data besar
Walau bagaimanapun, terdapat juga masalah dengan menggunakan data besar, yang dianggap sebagai "badan berharga" dan mendapat banyak perhatian. Salah satu isu yang paling penting dan kontroversi ialah isu kebocoran data. Kategori kecil kebocoran maklumat ialah kebocoran maklumat peribadi. Sangat mudah untuk mengetahui maklumat peribadi dengan menggabungkan data besar. Contoh mudahnya ialah dengan menganalisis secara statistik pelayar internet seseorang, tapak yang dilawati dan penggunaan media sosial, adalah mungkin untuk mempelajari bukan sahaja jantina mereka, tetapi juga maklumat yang sangat terperinci seperti kehamilan atau status LGBT. Ini bukan sahaja pencerobohan privasi, tetapi juga berpotensi untuk digunakan untuk tujuan jenayah.
Di luar tahap peribadi ini, terdapat juga potensi untuk isu nasional, seperti kebocoran rahsia negara atau rahsia ketenteraan. Memandangkan kita berada di ambang apa yang dipanggil "era data besar", kita harus berhati-hati untuk memberi tumpuan semata-mata pada aspek komersial data besar. Jika kita mengabaikan kesan sampingan yang boleh dibawa oleh data besar, ia hanya menunggu masa sebelum masyarakat kita mengalami 'penyakit data besar'. Sebelum menggunakan data besar dengan bersungguh-sungguh, saya fikir adalah menjadi kebanggaan para intelektual moden untuk menyediakan rancangan untuk mencegah kesan sampingan data besar.
Menggabungkan Data Besar dan AI
Kepentingan data besar terikat dengan kemajuan dalam teknologi kecerdasan buatan (AI). AI boleh belajar daripada sejumlah besar data untuk membantu menyelesaikan masalah kompleks yang tidak dapat dikendalikan oleh manusia. Dalam penjagaan kesihatan, sebagai contoh, gabungan AI dan data besar merevolusikan cara pesakit didiagnosis dan dirawat. Algoritma AI boleh menganalisis rekod perubatan pesakit, maklumat genetik dan data gaya hidup untuk meramalkan kemungkinan mengembangkan penyakit dan mencadangkan rawatan yang diperibadikan.
Peranan data besar dan AI juga penting dalam bidang kenderaan autonomi. Kereta pandu sendiri menganalisis keadaan jalan raya, isyarat lalu lintas dan jarak antara kenderaan dalam masa nyata untuk memastikan pemanduan yang selamat dan cekap. Analisis ini tidak mungkin dilakukan tanpa teknologi AI yang boleh memproses dan belajar daripada sejumlah besar data. Gabungan data besar dan AI membuka kemungkinan baharu merentas industri dan akan memberi kesan besar pada masa depan teknologi.
Gabungan data besar dan AI membolehkan inovasi baharu yang tidak pernah kami bayangkan dan akan memainkan peranan besar dalam masa depan perubahan sosial. Tetapi dengan kemajuan teknologi ini datang isu etika dan sosial yang perlu ditangani. Mencari keseimbangan antara menggunakan dan melindungi data akan menjadi satu cabaran bagi kita semua, dan akan membantu kita membina masyarakat yang lebih maju.