Ilmu data (bahasa Inggris: data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur.[1][2] Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, analisis data, pengolahan data, manajemen data, kearsipan, pengelompokan data, penyajian data, distribusi data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang.
Pada tahun 1962, John Tukey menggambarkan sebuah bidang pengetahuan yang dia sebut "data analisis", yang telah menyusun data sains modern.[5] Tahun 1985, pada sesi kuliah yang diberikan oleh Akademi Sains Cina di Beijing, C.F Jeff Wu menggunakan istilah data sains untuk pertama kalinya sebagai alternatif nama untuk statistika.[6] Selanjutnya, peserta simposium statistika Universitas Montpellier II mengakui munculnya sebuah disiplin bidang baru yang fokus kepada berbagai macam bentuk dan asal data, yang dikombinasikan dengan membangun konsep menggunakan prinsip statistika dan data analisis dengan komputer.[7][8]
Istilah "data sains" bisa dilacak kembali ke tahun 1974, ketika Peter Naur mengajukan alternatif nama untuk ilmu komputer.[9] Pada tahun 1997 C.F. Jeff Wu sekali lagi menyarankan bahwa statistika harusnya diubah namanya menjadi data sains. Beliau beralasan bahwa nomenklatur baru tersebut akan membantu statistika melepaskan stereotip yang selama ini tidak akurat, seperti identik dengan akuntasi, atau hanya terbatas pada penggambaran data.[10] Pada tahun 1998, Hayashi Chikio berpendapat bahwa data sains adalah cabang ilmu pengetahuan baru dengan tiga aspek: desain data, pengumpulan data, dan analisis data.[8]
Selama tahun 1990-an, ada banyak istilah populer dalam proses menemukan pola pada kumpulan data (yang sangat luas) termasuk "penemuan pengetahuan" dan "penambangan data".[9][11]
Penggunaan di era modern
Peng-artian modern dari data sains sebagai sebuah cabang ilmu baru salah satunya berkat William S.Cleveland.[12] Dalam sebuah makalah tahun 2001 dia menganjurkan perluasan teori statistik lebih dalam ke wilayah teknis; karena akan mengubah bidang secara signifikan, sehingga membutuhkan nama baru.[11] "Data sains" menjadi lebih banyak dipakai pada tahun-tahun berikutnya setelah tahun 2002, Komite Data untuk Ilmu Pengetahuan dan Teknologi merilis Data Science Journal. Di tahun 2003, Columbia University merilis The Journal of Data Science.[11] Pada 2014 Asosiasi Statistika Amerika mengubah nama satu seksinya menjadi Pembelajaran Statistik dan Data Sains, yang menggambarkan kepopuleran dari data sains.[13]
Pada tahun 2008 DJ Patil dan Jeff Hammerbacher mempelopori gelar profesional dari "data saintis".[14] Meskipun gelar tersebut telah digunakan oleh Dewan Sains Nasional pada laporan mereka di tahun 2005, "Long-Lived Digital Data Collections: Enabling Research an Education pada Abad ke-21", yang secara luas mengacu pada peran kunci dalam mengelola sebuah kumpulan data digital.[15]
Ilmu data, ilmu disiplin terapan
Ilmu data, sesuai dengan namanya, adalah gabungan/kombinasi dari ilmu-ilmu pasti dan ilmu ekonomi (khususnya bisnis dan manajemen, terkadang juga akuntansi). Berbagai ilmu tersebut antara lain:[16]
Inti dari semua ilmu tersebut adalah pemahaman terhadap data dan pengolahannya untuk menentukan kebijakan dalam bisnis dan perekonomian suatu perusahaan.[17]
^"Predictive Analytics Degree: Northwestern SPS". northwestern.edu. Northwestern University. Diakses tanggal 28 May 2016. The Master of Science in Predictive Analytics (MSPA) program, established in 2011, is a fully online part-time graduate program, one of the first to offer dedicated training in data science
^Data science and its applications = La @science des données et ses applications. Escoufier, Yves., Hayashi, Chikio (1918-....)., Fichet, Bernard. Tokyo: Academic Press/Harcourt Brace. 1995. ISBN 0-12-241770-4.