KD 3.9 MENERAPKAN TEKHNIK PENELUSURAN SEARCH ENGINE
KD 3.9
MENERAPKAN TEKNIK PENELUSURAN SEARCH ENGINE
Mesin Pencari Web
Mesin pencari
web atau mesin telusur web (bahasa Inggris: web search engine) adalah program
komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang
tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam
sebuah ataupun sejumlah komputer peladen dalam suatu jaringan. Mesin pencari
merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia.
Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali
diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas
yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa
terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar,
ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui
melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basis data
ataupun direktori web. Sebagian besar mesin pencari dijalankan oleh perusahaan
swasta yang menggunakan algoritma kepemilikan dan basis data tertutup, di
antaranya yang paling populer adalah safari Google (MSN Search dan Yahoo!).
Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open
source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.
Sejarah
Saat awal
perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang berisikan
daftar situs web yang ada di internet melalui peladen web CERN. Sejarah yang
mencatat sejak tahun 1992 masih ada hingga kini. Dengan semakin banyaknya situs
web yang aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh
manusia. Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian
di internet adalah Archie yang berasal dari kata “archive” tanpa menggunakan
huruf “v”. Archie dibuat tahun 1990 oleh Alan Emtage,
Bill Heelan dan
J. Peter Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas McGill,
Amerika Serikat. Cara kerja program tersebut adalah mengunduh daftar direktori
serta berkas yang terdapat pada layanan ftp publik (anonim) kemudian memuatnya
ke dalam basisdata yang memungkinkan pencarian.
Mesin pencari
lainnya seperti Aliweb, muncul di 1993 dan masih berjalan hingga saat ini.
Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha
komersial yang cukup besar adalah Lycos, yang dimulai di Carnegie Mellon
University sebagai proyek riset pada tahun 1994.
Segera setelah
itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan
popularitas. Termasuk di antaranya adalah safari web browsing yang aman dan
untuk publik. Masing-masing bersaing dengan menambahkan layakan-layanan
tambahan seperti yang dilakukan oleh Yahoo.
Tahun 2002
Yahoo! mengakuisisi Inktomi, setahun kemudian mengakuisisi AlltheWeb dan
Altavista kemudian meluncurkan mesin pencari sendiri yang didasarkan pada
teknologi gabungan dari mesin-mesin pencari yang telah diakuisisinya serta
memberikan layanan yang mengutamakan pencarian Web daripada layanan-layanan
lainnya.
Di bulan
desember 2003, Orase menerbitkan versi pertama dari teknologi pencari
waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat unjuk kerja
yang jauh lebih baik.
Mesin pencari
juga dikenal sebagai target investasi internet yang terjadi pada akhir tahun
1990-an. Beberapa perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui
mencatat keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan
mesin pencari, dan hanya memasarkannya pada edisi-edisi enterprise saja, contoh
Northern Light sebelumnya diketahui merupakan salah satu perintis layanan mesin
pencari di internet.
Buku Osmar R.
Zaïane From Resource Discovery to Knowledge Discovery on the Internet
menjelaskan secara rinci sejarah teknologi mesin pencari sebelum munculnya
Google. Mesin-mesin pencari lainnya mencakup a9.com, AlltheWeb, Ask Jeeves,
Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.
Google
Google muncul
pada akhir tahun 1997, di mana Google memasuki pasar yang telah diisi oleh para
pesaing lain dalam penyediaan layanan mesin pencari, seperti Yahoo, Altavista,
HotBot, Excite, InfoSeek dan Lycos, di mana perusahaan-perusahaan tersebut
mengklaim sebagian perusahaan yang bergerak dalam bidang layanan pencarian di
internet. Hingga akhirnya Google mampu menjadi sebagai penyedia mesin pencari
yang cukup diperhitungkan di dunia.
Saat tingginya
persaingan antar mesin pencari yang ada, namun mesin pencari lain tidak mampu
menghentikan kesuksesan Google. Setelah Yahoo mampu pada posisi puncak di
sekitar tahun 2000, Google mampu menerobos liga besar tersebut. sehingga Google
dipandang sebagai mesin pencari yang utama seperti yang kita ketahui pada hari
ini.
Yahoo!
Yahoo! raja
direktori di internet, di samping para pengguna internet melihat DMOZ serta
LookSmart berusaha menurunkan nya dari posisi puncak tersebut. Akhir-akhir ini,
telah tumbuh secara cepat dalam ukurannya, mereka pun sudah memiliki harga
sehingga mudah untuk memasukinya, dengan demikian, mendapatkan sebuah daftar
pada direktori Yahoo memang memiliki nilai yang tinggi.
Pada tahun 2001,
mesin pencari Google berkembang besar. Keberhasilan ini didasarkan pada bagian
konsep dasar dari link popularity dan PageRank. Setiap halaman diurutkan
berdasarkan seberapa banyak situs yang terkait, dari sebuah premis bahwa situs
yang diinginkan pasti lebih banyak terhubung daripada yang lain. Rangking situs
(The PageRank)dari sebuah link halaman dan jumlah link dari halaman-halaman
tersebut merupakan masukan bagi Rangking situs yang bersangkutan. Hal ini
memungkinkan bagi Google untuk mengurutkan hasilnya berdasarkan seberapa banyak
halaman situs yang menuju ke halaman yang ditemukannya. User interface Google
sangat disukai oleh pengguna, dan hal ini berkembang ke para pesaingnya.
Kategori Alat Pencari
Saat ini, tiga
bentuk dari alat bantu pencarian ini. Menggunakan strategi yang berbeda untuk
memanfaatkan kemampuan potensial dari masing-masing nya, yaitu
Mesin Pencari dan Mesin Pencari-meta
Karakteristik:
Menyimpan data dalam bentuk teks penuh pada
halaman yang terpilih,
Pencarian berdasarkan kata kunci, mereka
mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang ada dalam
dokumen,
Tidak perlu dilakukan browsing, dan tidak
ada subjek dari kategori,
Database dijaring dan dikumpulkan oleh
spidr, yaitu komputer yang memiliki program robot, dengan kemampuan seminimal
mungkin dari pandangan atau sentuhan manusia,
Ukuran search engine:dari skala kecil
hingga mampu menyimpan sangat banyak (sekitar hingga 20 miliar halaman web).
Meta-search engine dengan cepat melakukan
pencarian ke dalam beberapa data base dari berbagai search engine dalam satu
kali permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil
pencarian dari beberapa mesin pencari yang mereka libatkan. Contoh : Search
engine: Google, Yahoo Search, Ask.com. Meta-Search : Dogpile, Copernic, dan
lainnya.
Subject Directories
Karakteristik :
Seleksi dari situs yang ada merupakan
seleksi langsung yang dilakukan oleh manusia, kadang kala para ahli untuk
subjek tertentu,
Sering dengan hati-hati dievaluasi dan
menjaga keterbaruan informasi yang mereka miliki, namun tidak selalu,
kadang-kadang tidak, terutama untuk mereka yang telah memiliki data yang banyak
dan bersifat general,
Biasanya dikelola dalam bentuk subjek dan
direktori yang tersusun secara hierarki,
Sering dilengkapi dengan catatan mengenai
deskripsinya ( tidak untuk Yahoo),
Subjek dapat di-browse subjek dan
kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,
Dokumen yang tidak penuh teks. pencarian
diminta lebih spesifik dibandingkan dengan pencarian melalui mesin pencari,
karena kata kunci tidak bisa dibandingkan dengan isi dari halaman suatu situs,
melainkan hanya pada subjek, kategori-kategori, dan deskripsi.
Terdapat ribuan atau bahkan lebih subjek
direktori dalam praktik dan kenyataannya apa saja yang dipikirkan di sana.
Specialized Database
Karakteristik :
Merupakan web yang menyediakan akses
melalui suatu kotak pencarian ke dalam isi database pada sebuah komputer di
suatu tempat,
Dapat saja berubah berbagai topik, dapat
pula juga hal yang komersial, pekerjaan yang spesifik, pemerintahan, dll
Juga terdiri dari banyak halaman yang
menghasilkan hasil pencarian dari katalog direktori online.
Prinsip Umum
Dari mesin pencari
Sistem kinerja
mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya
dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan
program yang men-download halaman-halaman yang mereka temukan, mirip dengan
browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi
yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya
pada saat itu, sedangkan spider tidak melakukan untuk menampilkan dalam bentuk
yang terlihat seperti itu, karena kepentingannya adalah untuk mesin, bukan
untuk manusia, spider pun dijalankan oleh mesin secara otomatis. Kepentingannya
adalah untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan
kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan
program yang dimiliki search engine untuk melacak dan menemukan link yang
terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan
spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang
ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang
belum dikenal oleh search engine.
Indexer
Komponen ini
melakukan aktivitas untuk menguraikan masing-masing halaman dan meneliti
berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan,
tag HTML khusus, dll.
Database
Merupakan tempat
standar untuk menyimpan data-data dari halaman yang telah dikunjungi,
di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari
suatu search engine.
Result Engine
Mesin yang
melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search
engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari
hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk
penampulan yang akan ditampilkan.
Proses ini
dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search
engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh
mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka
gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach
engine tersebut.
Web Server
Merupakan
komponen yang melayani permintaan dan memberikan respon balik dari permintaan
tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam
format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci
pencarian yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab
dalam menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta
informasi.
Pangsa pasar
Wiki letter
w.svg Bagian ini memerlukan
pengembangan dengan: Informasi tentang mesin pencari nasional seperti StatCounter,
Yandex, Naver dan pangsa pasar di negara bersangkutan.
Mesin
pencari Pangsa pasar Mei 2011 Pangsa pasar Desember 2010
Terdapat ratusan
bahkan ribuan mesin pencari yang ada di internet, dan kapasitas mesin tersebut
akan selalu tumbuh dari waktu ke waktu. Dari sebanyak itu, hanya sebagian kecil
yang berpengaruh besar dalam lalulintas untuk pengantar pengunjungnya ke situs
tersebut. untuk itu, harus pintar dalam memilih mereka yang tepat terutama
dalam efisiensi dan efektifitas waktu yang anda miliki dalam mencapai sasaran
yang diinginkan, karena situs yang tidak terlalu populer belum tentu akan
berpengaruh besar terhadap pertumbuhanke situs yang dikelola. Apalagi juka
pendaftaran situs-situs penyedia layanan pencarian tersebut dilakukan satu
persatu, akan membuang waktu.
Cara mudahnya,
lebih baik menggunakan software pendaftar ke mesin pencari yang banyak beredar
di internet, sehingga proses pendaftaran bisa dilakukan secara otomatis melalui
software tersebut.
Berikut ini
adalah beberapa mesin pencari:
Google ( http://www.google.com/ )
Microsoft ( http://www.bing.com/ )
Yahoo ( http://www.yahoo.com/ )
Open Directory ( http://www.dmoz.com/ )
MSN ( http://www.msn.com/ )
Live ( http://www.live.com )
Altavista ( http://www.altavista.com )
AOL ( http://www.aol.com )
Altheweb ( http://www.althweb.com )
Baidu ( http://www.baidu.com )
Looksmart ( http://www.looksmart.com )
Solusee ( http://www.solusee.com )
Mesin pencari vertikal mobil.cari.co (
http://mobil.cari.co )
Fitur Pencarian Google
Secara umum,
jenis pencarian pada mesin pencarian/website ada dua yaitu: Basic Search dan
Advanced Search. Basic Search adalah fitur pencarian yang sudah biasa kita
gunakan yaitu ketika mengakses langsung, missal pada google.com. Sedangkan
Advanced Search menyediakan berbagai pilihan fitur pencarian baik untuk
operator dasar, file format yang ingin kita cari, bahasa, region, dsb.
Sebenarnya masih
sangat banyak fitur pencarian yang bisa kita gunakan, tapi tidak terdapat di menu
pilihan Advanced Search. Dengan kata lain kita harus memasukannya query di form
pencarian di Basic Search langsung. Di bawah ini akan disajikan permainan query
dan operator pencarian.
Fitur Pencarian Dasar
FRASE: Mencari informasi yang mengandung frase
yang dicari dengan menggunakan tanda “”. Contoh: “kesehatan reproduksi”
SINONIM (~): Mencari kata beserta
sinonim-sinonimnya. Contoh di bawah akan membawa hasil pencarian: bayi baru
lahir (infant) dan sinonimnya. Contoh: ~infant
ASTERIK (*): Karakter pengganti kata. Dari
contoh di bawah, hasil yang didapat bisa: ikan bakar pedas, ikan goreng pedas,
ikan masak pedas, dsb. Contoh: ikan * pedas
TANDA TITIK (.): Karakter pengganti huruf,
angka dan karakter tunggal. Dari contoh di bawah, hasil yang didapat bisa:
kopi, koki, kodi, dsb. Contoh: ko.i
CASE INSENSITIVE: Pencarian di Google
menganggap kapital dan bukan kapital sebagai sesuatu yang sama. Jadi, kehamilan
aterm, Kehamilan Aterm, KEHAMILAN aterm, akan membawa hasil pencarian yang sama
PENGABAIAN KATA: Google mengabaikan keyword
berupa karakter tunggal dan kata-kata berikut: a, about, an, and, are, as, at,
b, by, from, how, i , in, is, it, of, on, or, that, the, this, to, we, what,
when, where, which, with. Apabila kita masih tetap menginginkan pencarian kata
tersebut, bisa dengan menggunakan karakter + di depan kata yang dicari (contoh:
Love Rain Episode +I), atau bisa juga dengan menganggapnya sebagai frase
(contoh: “Love Rain Episode I”)
I’M FEELING LUCKY: Akan membawa kita
langsung menuju ke hasil pencarian pertama dari query kita.
Fitur Pencarian Lanjut
DEFINE: Mencari definisi dari sebuah
terminologi. Dari contoh di bawah, hasil yang didapat adalah berbagai definisi
tentang e-learning dari berbagai sumber. Contoh: define:e-learning
CACHE: Menampilkan situs web yang telah
diindeks oleh Google meskipun sudah tidak aktif lagi. Contoh di bawah akan
menghasilkan pencarian kata php pada situs bidanku.com yang ada di indeks
Google. Contoh: cache:bidanku.com php
LINK: Menampilkan daftar link yang mengarah
ke sebuah situs. Contoh di bawah akan menampilkan daftar link yang mengarah ke
situs bidanku.com. Contoh: link:bidanku.com
RELATED: Menampilkan daftar situs yang
serupa, mirip atau memiliki hubungan dengan suatu situs. Contoh:
related:oshigita.wordpress.com
INFO: Menampilkan informasi yang Google
ketahui tentang sebuah situs. Contoh: info:oshigita.wordpress.com
SITE: Menampilkan pencarian khusus di suatu
situs yang ditunjuk. Contoh: java site:bidanku.com
FILETYPE: Menampilkan hasil pencarian
berupa suatu jenis (ekstensi) file tertentu. Jenis file yang bisa dicari
adalah: doc, xls, rtf, swf, ps, lwp, wri, ppt, pdf, mdb, txt, dsb. Contoh di
bawah akan menampilkan hasil pencarian berupafile PDF yang mengandung keyword
preeklamsi berat. Contoh: preeklamsi berat filetype:pdf
ALLINTITLE: Menampilkan seluruh kata yang
dicari dalam TITLE halaman. Contoh di bawah akan menghasilkan halaman yang
memiliki title mola hidatidosa. Allintitle ini tidak dapat digabungkan dengan
operator (sintaks) lain. Gunakan intitle untuk keperluan itu. Contoh:
allintitle:mola hidatidosa
INTITLE: Menampilkan satu kata yang dicari
dalam TITLE halaman. Contoh di bawah akan menghasilkan halaman yang memiliki
title kehamilan dan isi halaman yang mengandung kata perdarahan. Contoh:
intitle:kehamilan perdarahan
ALLINURL: Menampilkan seluruh kata yang
dicari di dalam URL. Contoh di bawah akan menghasilkan daftar URL yang
mengandung kata imunisasi dan bayi. Allinurl ini tidak dapat digabungkan dengan
operator (sintaks) lain. Gunakan inurl untuk keperluan itu. Contoh:
allinurl:imunisasi bayi
INURL: Menampilkan satu kata yang dicari di
dalam URL. Contoh di bawah akan menghasilkan daftar URL yang mengandung kata
kontrasepsi dan isi halaman yang mengandung kata hormonal. Contoh:
inurl:kontrasepsi hormonal
Boolean Logic
Boolean logic adalah suatu pencarian
pelacakan yang menyatakan tentang hubungan antara variabel yang dicari dengan
variabel terkait. Boolean logic juga merupakan identifikasi spesifik tentang
artikel yang akan dicari. Boolean logic dikembangkan oleh George Boole
(1815-1864), adalah suatu metode pencarian informasi, yang memfokuskan hasil
penelusuran dimana pencarian datanya menggunakan kata kunci.
Boolean logic terdiri dari operasi logika
AND, OR dan NOT. Pada fitur pencarian Google, operasi ini merupakan bagian dari
fitur pencarian dasar. Penggunaan operasi logika ini dapat memudahkan user
dalam mendapatkan informasi yang diinginkan. Boolean logic merupakan operasi
logika yang digunakan untuk mendapatkan informasi di PubMed (NCBI).
AND: Mencari informasi yang mengandung
kedua kata yang dicari. Bisa menggunakan salah satu dari tiga alternatif
berikut. Contoh: kehamilan gemelli , kehamilan AND gemeli, kehamilan+gemelli
OR: Mencari informasi yang mengandung salah
satu dari kedua kata. Bisa menggunakan salah satu dari dua alternatif berikut.
Contoh: kembar OR gemelli, kembar | gemelli
NOT: Hasil pencarian mengandung kata yang
di depan, tapi tidak yang dibelakang minus (-). Contoh di bawah akan mencari
informasi yang mengandung kata kontrasepsi tapi bukan suntik. Contoh:
kontrasepsi –suntik.
Pencarian yang kita lakukan akan semakin
efektif apabila kita mencoba menggabungkan beberapa operator baik yang ada di
fitur pencarian dasar, pencarian lanjut, maupun Boolean logic. Misalnya, kita
ingin mencari file PDF tentang kehamilan ektopik (ectopic pregnancy) yang ada
di situs http://www.ncbi.nlm.nih.gov. Maka kita gabungkan tiga operator
menjadi; Contoh: ectopic AND pregnancy filetype:pdf site:www.ncbi.nlm.nih.gov.
Menggunakan Penelusuran
Lanjutan Google
Search engine Google mempunyai fasilitas
Penelusuran Lanjutan, dengan menggunakan fasilitas google penelusuran lanjutan,
maka memudahkan kita untuk memperoleh informasi yang diinginkan. Misalnya, saya
hanya ingin google menampilkan link website yang ada file pdfnya, atau file
word saja, dan lain lain. Ingin yang berbahasa indonesia atau inggris saja, dan
masih ada beberapa pilihan penelusuran lainnya.
Komentar
Posting Komentar