KD 3.9 MENERAPKAN TEKHNIK PENELUSURAN SEARCH ENGINE




KD 3.9
MENERAPKAN TEKNIK PENELUSURAN SEARCH ENGINE

Mesin Pencari Web

Mesin pencari web atau mesin telusur web (bahasa Inggris: web search engine) adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladen dalam suatu jaringan. Mesin pencari merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basis data ataupun direktori web. Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikan dan basis data tertutup, di antaranya yang paling populer adalah safari Google (MSN Search dan Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.

Sejarah

Saat awal perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang berisikan daftar situs web yang ada di internet melalui peladen web CERN. Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini. Dengan semakin banyaknya situs web yang aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian di internet adalah Archie yang berasal dari kata “archive” tanpa menggunakan huruf “v”. Archie dibuat tahun 1990 oleh Alan Emtage,

Bill Heelan dan J. Peter Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas McGill, Amerika Serikat. Cara kerja program tersebut adalah mengunduh daftar direktori serta berkas yang terdapat pada layanan ftp publik (anonim) kemudian memuatnya ke dalam basisdata yang memungkinkan pencarian.

Mesin pencari lainnya seperti Aliweb, muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar adalah Lycos, yang dimulai di Carnegie Mellon University sebagai proyek riset pada tahun 1994.

Segera setelah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan popularitas. Termasuk di antaranya adalah safari web browsing yang aman dan untuk publik. Masing-masing bersaing dengan menambahkan layakan-layanan tambahan seperti yang dilakukan oleh Yahoo.

Tahun 2002 Yahoo! mengakuisisi Inktomi, setahun kemudian mengakuisisi AlltheWeb dan Altavista kemudian meluncurkan mesin pencari sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin pencari yang telah diakuisisinya serta memberikan layanan yang mengutamakan pencarian Web daripada layanan-layanan lainnya.

Di bulan desember 2003, Orase menerbitkan versi pertama dari teknologi pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat unjuk kerja yang jauh lebih baik.

Mesin pencari juga dikenal sebagai target investasi internet yang terjadi pada akhir tahun 1990-an. Beberapa perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui mencatat keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan mesin pencari, dan hanya memasarkannya pada edisi-edisi enterprise saja, contoh Northern Light sebelumnya diketahui merupakan salah satu perintis layanan mesin pencari di internet.

Buku Osmar R. Zaïane From Resource Discovery to Knowledge Discovery on the Internet menjelaskan secara rinci sejarah teknologi mesin pencari sebelum munculnya Google. Mesin-mesin pencari lainnya mencakup a9.com, AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.

Google

Google muncul pada akhir tahun 1997, di mana Google memasuki pasar yang telah diisi oleh para pesaing lain dalam penyediaan layanan mesin pencari, seperti Yahoo, Altavista, HotBot, Excite, InfoSeek dan Lycos, di mana perusahaan-perusahaan tersebut mengklaim sebagian perusahaan yang bergerak dalam bidang layanan pencarian di internet. Hingga akhirnya Google mampu menjadi sebagai penyedia mesin pencari yang cukup diperhitungkan di dunia.

Saat tingginya persaingan antar mesin pencari yang ada, namun mesin pencari lain tidak mampu menghentikan kesuksesan Google. Setelah Yahoo mampu pada posisi puncak di sekitar tahun 2000, Google mampu menerobos liga besar tersebut. sehingga Google dipandang sebagai mesin pencari yang utama seperti yang kita ketahui pada hari ini.

Yahoo!

Yahoo! raja direktori di internet, di samping para pengguna internet melihat DMOZ serta LookSmart berusaha menurunkan nya dari posisi puncak tersebut. Akhir-akhir ini, telah tumbuh secara cepat dalam ukurannya, mereka pun sudah memiliki harga sehingga mudah untuk memasukinya, dengan demikian, mendapatkan sebuah daftar pada direktori Yahoo memang memiliki nilai yang tinggi.

Pada tahun 2001, mesin pencari Google berkembang besar. Keberhasilan ini didasarkan pada bagian konsep dasar dari link popularity dan PageRank. Setiap halaman diurutkan berdasarkan seberapa banyak situs yang terkait, dari sebuah premis bahwa situs yang diinginkan pasti lebih banyak terhubung daripada yang lain. Rangking situs (The PageRank)dari sebuah link halaman dan jumlah link dari halaman-halaman tersebut merupakan masukan bagi Rangking situs yang bersangkutan. Hal ini memungkinkan bagi Google untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang menuju ke halaman yang ditemukannya. User interface Google sangat disukai oleh pengguna, dan hal ini berkembang ke para pesaingnya.

Kategori Alat Pencari

Saat ini, tiga bentuk dari alat bantu pencarian ini. Menggunakan strategi yang berbeda untuk memanfaatkan kemampuan potensial dari masing-masing nya, yaitu

    Mesin Pencari dan Mesin Pencari-meta

    Karakteristik:

    Menyimpan data dalam bentuk teks penuh pada halaman yang terpilih,

    Pencarian berdasarkan kata kunci, mereka mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang ada dalam dokumen,

    Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori,

    Database dijaring dan dikumpulkan oleh spidr, yaitu komputer yang memiliki program robot, dengan kemampuan seminimal mungkin dari pandangan atau sentuhan manusia,

    Ukuran search engine:dari skala kecil hingga mampu menyimpan sangat banyak (sekitar hingga 20 miliar halaman web).

    Meta-search engine dengan cepat melakukan pencarian ke dalam beberapa data base dari berbagai search engine dalam satu kali permintaan. hasilnya adalah daftar yang hasilnya dan penggabungan hasil pencarian dari beberapa mesin pencari yang mereka libatkan. Contoh : Search engine: Google, Yahoo Search, Ask.com. Meta-Search : Dogpile, Copernic, dan lainnya.
    Subject Directories

    Karakteristik :

    Seleksi dari situs yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala para ahli untuk subjek tertentu,

    Sering dengan hati-hati dievaluasi dan menjaga keterbaruan informasi yang mereka miliki, namun tidak selalu, kadang-kadang tidak, terutama untuk mereka yang telah memiliki data yang banyak dan bersifat general,

    Biasanya dikelola dalam bentuk subjek dan direktori yang tersusun secara hierarki,

    Sering dilengkapi dengan catatan mengenai deskripsinya ( tidak untuk Yahoo),

    Subjek dapat di-browse subjek dan kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,

    Dokumen yang tidak penuh teks. pencarian diminta lebih spesifik dibandingkan dengan pencarian melalui mesin pencari, karena kata kunci tidak bisa dibandingkan dengan isi dari halaman suatu situs, melainkan hanya pada subjek, kategori-kategori, dan deskripsi.

    Terdapat ribuan atau bahkan lebih subjek direktori dalam praktik dan kenyataannya apa saja yang dipikirkan di sana.

    Specialized Database

    Karakteristik :

    Merupakan web yang menyediakan akses melalui suatu kotak pencarian ke dalam isi database pada sebuah komputer di suatu tempat,

    Dapat saja berubah berbagai topik, dapat pula juga hal yang komersial, pekerjaan yang spesifik, pemerintahan, dll

    Juga terdiri dari banyak halaman yang menghasilkan hasil pencarian dari katalog direktori online.

Prinsip Umum Dari mesin pencari

Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.

Spider

Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.

Crawler

Merupakan program yang dimiliki search engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search engine.

Indexer

Komponen ini melakukan aktivitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.

Database

Merupakan tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari suatu search engine.

Result Engine

Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.

Proses ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine tersebut.

Web Server

Merupakan komponen yang melayani permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta informasi.

Pangsa pasar

Wiki letter w.svg    Bagian ini memerlukan pengembangan dengan: Informasi tentang mesin pencari nasional seperti StatCounter, Yandex, Naver dan pangsa pasar di negara bersangkutan.

Mesin pencari    Pangsa pasar Mei 2011    Pangsa pasar Desember 2010


Terdapat ratusan bahkan ribuan mesin pencari yang ada di internet, dan kapasitas mesin tersebut akan selalu tumbuh dari waktu ke waktu. Dari sebanyak itu, hanya sebagian kecil yang berpengaruh besar dalam lalulintas untuk pengantar pengunjungnya ke situs tersebut. untuk itu, harus pintar dalam memilih mereka yang tepat terutama dalam efisiensi dan efektifitas waktu yang anda miliki dalam mencapai sasaran yang diinginkan, karena situs yang tidak terlalu populer belum tentu akan berpengaruh besar terhadap pertumbuhanke situs yang dikelola. Apalagi juka pendaftaran situs-situs penyedia layanan pencarian tersebut dilakukan satu persatu, akan membuang waktu.

Cara mudahnya, lebih baik menggunakan software pendaftar ke mesin pencari yang banyak beredar di internet, sehingga proses pendaftaran bisa dilakukan secara otomatis melalui software tersebut.

Berikut ini adalah beberapa mesin pencari:

Google ( http://www.google.com/ )

Microsoft ( http://www.bing.com/ )

Yahoo ( http://www.yahoo.com/ )

Open Directory ( http://www.dmoz.com/ )

MSN ( http://www.msn.com/ )

Live ( http://www.live.com )

Altavista ( http://www.altavista.com )

AOL ( http://www.aol.com )

Altheweb ( http://www.althweb.com )

Baidu ( http://www.baidu.com )

Looksmart ( http://www.looksmart.com )

Solusee ( http://www.solusee.com )

Mesin pencari vertikal mobil.cari.co ( http://mobil.cari.co )

Fitur Pencarian Google

Secara umum, jenis pencarian pada mesin pencarian/website ada dua yaitu: Basic Search dan Advanced Search. Basic Search adalah fitur pencarian yang sudah biasa kita gunakan yaitu ketika mengakses langsung, missal pada google.com. Sedangkan Advanced Search menyediakan berbagai pilihan fitur pencarian baik untuk operator dasar, file format yang ingin kita cari, bahasa, region, dsb.

Sebenarnya masih sangat banyak fitur pencarian yang bisa kita gunakan, tapi tidak terdapat di menu pilihan Advanced Search. Dengan kata lain kita harus memasukannya query di form pencarian di Basic Search langsung. Di bawah ini akan disajikan permainan query dan operator pencarian.

Fitur Pencarian Dasar

    FRASE: Mencari informasi yang mengandung frase yang dicari dengan menggunakan tanda “”. Contoh: “kesehatan reproduksi”
    SINONIM (~): Mencari kata beserta sinonim-sinonimnya. Contoh di bawah akan membawa hasil pencarian: bayi baru lahir (infant) dan sinonimnya. Contoh: ~infant
    ASTERIK (*): Karakter pengganti kata. Dari contoh di bawah, hasil yang didapat bisa: ikan bakar pedas, ikan goreng pedas, ikan masak pedas, dsb. Contoh: ikan * pedas
    TANDA TITIK (.): Karakter pengganti huruf, angka dan karakter tunggal. Dari contoh di bawah, hasil yang didapat bisa: kopi, koki, kodi, dsb. Contoh: ko.i
    CASE INSENSITIVE: Pencarian di Google menganggap kapital dan bukan kapital sebagai sesuatu yang sama. Jadi, kehamilan aterm, Kehamilan Aterm, KEHAMILAN aterm, akan membawa hasil pencarian yang sama
    PENGABAIAN KATA: Google mengabaikan keyword berupa karakter tunggal dan kata-kata berikut: a, about, an, and, are, as, at, b, by, from, how, i , in, is, it, of, on, or, that, the, this, to, we, what, when, where, which, with. Apabila kita masih tetap menginginkan pencarian kata tersebut, bisa dengan menggunakan karakter + di depan kata yang dicari (contoh: Love Rain Episode +I), atau bisa juga dengan menganggapnya sebagai frase (contoh: “Love Rain Episode I”)
    I’M FEELING LUCKY: Akan membawa kita langsung menuju ke hasil pencarian pertama dari query kita.
    Fitur Pencarian Lanjut
    DEFINE: Mencari definisi dari sebuah terminologi. Dari contoh di bawah, hasil yang didapat adalah berbagai definisi tentang e-learning dari berbagai sumber. Contoh: define:e-learning
    CACHE: Menampilkan situs web yang telah diindeks oleh Google meskipun sudah tidak aktif lagi. Contoh di bawah akan menghasilkan pencarian kata php pada situs bidanku.com yang ada di indeks Google. Contoh: cache:bidanku.com php
    LINK: Menampilkan daftar link yang mengarah ke sebuah situs. Contoh di bawah akan menampilkan daftar link yang mengarah ke situs bidanku.com. Contoh: link:bidanku.com
    RELATED: Menampilkan daftar situs yang serupa, mirip atau memiliki hubungan dengan suatu situs. Contoh: related:oshigita.wordpress.com
    INFO: Menampilkan informasi yang Google ketahui tentang sebuah situs. Contoh: info:oshigita.wordpress.com
    SITE: Menampilkan pencarian khusus di suatu situs yang ditunjuk. Contoh: java site:bidanku.com
    FILETYPE: Menampilkan hasil pencarian berupa suatu jenis (ekstensi) file tertentu. Jenis file yang bisa dicari adalah: doc, xls, rtf, swf, ps, lwp, wri, ppt, pdf, mdb, txt, dsb. Contoh di bawah akan menampilkan hasil pencarian berupafile PDF yang mengandung keyword preeklamsi berat. Contoh: preeklamsi berat filetype:pdf
    ALLINTITLE: Menampilkan seluruh kata yang dicari dalam TITLE halaman. Contoh di bawah akan menghasilkan halaman yang memiliki title mola hidatidosa. Allintitle ini tidak dapat digabungkan dengan operator (sintaks) lain. Gunakan intitle untuk keperluan itu. Contoh: allintitle:mola hidatidosa
    INTITLE: Menampilkan satu kata yang dicari dalam TITLE halaman. Contoh di bawah akan menghasilkan halaman yang memiliki title kehamilan dan isi halaman yang mengandung kata perdarahan. Contoh: intitle:kehamilan perdarahan
    ALLINURL: Menampilkan seluruh kata yang dicari di dalam URL. Contoh di bawah akan menghasilkan daftar URL yang mengandung kata imunisasi dan bayi. Allinurl ini tidak dapat digabungkan dengan operator (sintaks) lain. Gunakan inurl untuk keperluan itu. Contoh: allinurl:imunisasi bayi
    INURL: Menampilkan satu kata yang dicari di dalam URL. Contoh di bawah akan menghasilkan daftar URL yang mengandung kata kontrasepsi dan isi halaman yang mengandung kata hormonal. Contoh: inurl:kontrasepsi hormonal

    Boolean Logic

    Boolean logic adalah suatu pencarian pelacakan yang menyatakan tentang hubungan antara variabel yang dicari dengan variabel terkait. Boolean logic juga merupakan identifikasi spesifik tentang artikel yang akan dicari. Boolean logic dikembangkan oleh George Boole (1815-1864), adalah suatu metode pencarian informasi, yang memfokuskan hasil penelusuran dimana pencarian datanya menggunakan kata kunci.

    Boolean logic terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian Google, operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan operasi logika ini dapat memudahkan user dalam mendapatkan informasi yang diinginkan. Boolean logic merupakan operasi logika yang digunakan untuk mendapatkan informasi di PubMed (NCBI).

    AND: Mencari informasi yang mengandung kedua kata yang dicari. Bisa menggunakan salah satu dari tiga alternatif berikut. Contoh: kehamilan gemelli , kehamilan AND gemeli, kehamilan+gemelli

    OR: Mencari informasi yang mengandung salah satu dari kedua kata. Bisa menggunakan salah satu dari dua alternatif berikut. Contoh: kembar OR gemelli, kembar | gemelli

    NOT: Hasil pencarian mengandung kata yang di depan, tapi tidak yang dibelakang minus (-). Contoh di bawah akan mencari informasi yang mengandung kata kontrasepsi tapi bukan suntik. Contoh: kontrasepsi –suntik.

    Pencarian yang kita lakukan akan semakin efektif apabila kita mencoba menggabungkan beberapa operator baik yang ada di fitur pencarian dasar, pencarian lanjut, maupun Boolean logic. Misalnya, kita ingin mencari file PDF tentang kehamilan ektopik (ectopic pregnancy) yang ada di situs http://www.ncbi.nlm.nih.gov. Maka kita gabungkan tiga operator menjadi; Contoh: ectopic AND pregnancy filetype:pdf site:www.ncbi.nlm.nih.gov.

    Menggunakan Penelusuran Lanjutan Google

    Search engine Google mempunyai fasilitas Penelusuran Lanjutan, dengan menggunakan fasilitas google penelusuran lanjutan, maka memudahkan kita untuk memperoleh informasi yang diinginkan. Misalnya, saya hanya ingin google menampilkan link website yang ada file pdfnya, atau file word saja, dan lain lain. Ingin yang berbahasa indonesia atau inggris saja, dan masih ada beberapa pilihan penelusuran lainnya.

Komentar

Postingan populer dari blog ini

KD 3.7 MENGANALISIS PEMBUATAN E-BOOK

KD 3.8 MEMAHAMI KONSEP KEWARGAAN DIGITAL

SIMKOMDIG Materi KD 3.3 Paragraf Deskriptif,Argumentatif,Naratif,Persuasif