Pengorekan data atau dapat disebut dengan data scrapping adalah teknik otomatisasi yang digunakkan untuk mengekstrak dan pengolahan data dari sebuah website, databse, aplikasi enterprise atau sistem legacy yang disimpan pada sebuah file dalam format tabular atau spreadsheet, selain itu teknik ini juga cukup mudah digunakkan karena dapat memberikan informasi yang dapat dibaca secara nyata.[1][2]
Cara kerja data scrapping
cara yang digunakkan untuk memperoleh data dari web dapat menggunakan tools, yang mempunyai tahapan yang pertama adalah proses request ke web dengan command GET untuk mengekstrak data, selanjutnya adalah parse dimana data spesifik yang dihasilkan dari tools data scrapping, kemudian informasi yang telah didapat akan ditampilkan pada display.[1][2]
Jenis data scrapping
data scrapping memiliki dua jenis yang berbeda yaitu web scrapping dan screenscrapping. web scrapping adalah cara yang digunakan untuk pengekstrakan data secara spesifik yang diambil dari sebuah website dengan menggunakan pengaksesan pada source code, source code yanng dapat digunakan seperti HTML, CSS dan javascript ataupun penggunaan API yang disediakan oleh pemilik website itu sendiri. sedangkan screen scrapping adalah tipe pengekstrakan data dengan menggunakan metode analisis visual interfances yang terdapat pada web dan dapat dilihat secara langsung.[1][2]
Referensi
Bahan bacaan terkait
- Hemenway, Kevin and Calishain, Tara. Spidering Hacks. Cambridge, Massachusetts: O'Reilly, 2003. ISBN 0-596-00577-6.