PERANCANGAN APLIKASI WEB SCRAPING UNTUK KOLEKSI KONTEN RESEP MASAKAN TRADISIONAL JAWA BERBASIS XML

  • Setyawan Wibisono
  • Mardi Siswo Utomo

Abstract

Proses untuk memisahkan konten utama halaman situs dengan bagian-bagian yang tidak berhubungan dengan isi disebut dengan scraping. Dengan teknik ini konten utama dari suatu halaman situs dapat diekstrak, dikoleksi dan selanjutnya dapat diproses oleh proses pengindekan. Sistem ini adalah perangkat lunak berbasis web dengan tujuan melakukan pengambilan isi dari konten halaman web.

Hal-hal yang dapat diwujudkan dalam sistem ini diantaranya: (1) Sistem dapat secara otomatis mengekstrak konten utama dari suatu halaman web, (2) Dalam penelitian ini digunakan halaman dokumen pada situs resmi sebuah produk makanan dengan merk Bango , (3) Pengambilan data/crawling Uniform Resource Locator (URL) pada situs resmi sebuah produk makanan merk Bango menggunakan aplikasi sphider, (4) Hasil scraping resep disimpan dalam basisdata, (5) Sistem ini dapat memproduksi data resep dengan format XML (eXtensible Markup Language), (6) Aplikasi diintegrasikan dalam bentuk plugin CMS wordpress yang dapat diunduh di secara bebas (7) Sistem diimplementasikan secara online menggunakan sebuah situs yang telah disiapkan.

Teknik web scraping dapat digunakan untuk mengambil konten resep masakan khas indonesia pada situs resep masakan yang memuat aneka kreasi resep masakan . Penyimpanan resep masakan ke dalam basisdata, mempermudah transformasi data ke bentuk lainnya.

 

Disajikan di Seminar Nasional Teknologi Industri, Universitas Trisakti Juli 2014

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed