Telusur tunak

Spamdexing atau telusur tunak[1] adalah manipulasi indeks mesin pencari yang disengaja. Ini melibatkan sejumlah metode, seperti membangun tautan dan mengulangi frasa yang tidak berhubungan, untuk memanipulasi relevansi atau keunggulan sumber daya yang diindeks dengan cara yang tidak sesuai dengan tujuan sistem pengindeksan. [2] [3]

Telusur tunak dapat dianggap sebagai bagian dari optimasi mesin pencari, [4] meskipun ada banyak metode SEO yang meningkatkan kualitas dan tampilan konten situs web dan menyajikan konten yang bermanfaat bagi banyak pengguna. [5]

Ringkasan

Mesin pencari menggunakan berbagai algoritma untuk menentukan peringkat relevansi. Beberapa di antaranya termasuk menentukan apakah istilah pencarian muncul di badan teks atau URL halaman web . Banyak mesin pencari memeriksa contoh penelusuran tunak dan akan menghapus halaman yang dicurigai dari indeks mereka. Selain itu, operator mesin pencari dapat dengan cepat memblokir daftar hasil dari seluruh situs web yang menggunakan pengindeksan spam, mungkin sebagai respons terhadap keluhan pengguna mengenai pencocokan palsu. Maraknya penelusuran tunak pada pertengahan tahun 1990an membuat mesin pencari terkemuka saat itu kurang berguna. Menggunakan metode yang tidak etis untuk membuat peringkat situs web lebih tinggi dalam hasil mesin pencari dibandingkan biasanya disebut dalam industri SEO (optimasi mesin pencari) sebagai "SEO topi hitam".[6] Metode ini lebih fokus pada pelanggaran aturan dan pedoman promosi mesin pencari. Selain itu, para pelakunya berisiko situs web mereka terkena sanksi berat oleh algoritma pemeringkatan hasil pencarian Google Panda dan Google Penguin .[7]

Teknik penelusuran tunak yang umum dapat diklasifikasikan menjadi dua kelas besar: telusur tunak konten [5] ( term spam ) dan telusur tunak tautan . [3]

Telusur tunak konten

Teknik-teknik ini melibatkan perubahan pandangan logis yang dimiliki mesin pencari terhadap konten halaman. Semuanya bertujuan untuk varian model ruang vektor untuk pengambilan informasi pada koleksi teks.

Pengisian kata kunci

Isian kata kunci melibatkan penempatan kata kunci yang dihitung dalam suatu halaman untuk meningkatkan jumlah kata kunci, variasi, dan kepadatan halaman. Hal ini berguna untuk membuat halaman tampak relevan bagi perayap web sehingga lebih mungkin ditemukan. Contoh: Promotor skema Ponzi memiliki situs yang mengiklankan penipuan dan ingin menarik orang ke situs tersebut. Penipu menempatkan teks tersembunyi yang sesuai untuk halaman penggemar grup musik populer di halaman tersebut, dengan harapan halaman tersebut akan terdaftar sebagai situs penggemar dan menerima banyak kunjungan dari pecinta musik. Program pengindeksan versi lama hanya menghitung seberapa sering kata kunci muncul, dan menggunakannya untuk menentukan tingkat relevansi. Kebanyakan mesin pencari modern memiliki kemampuan untuk menganalisis halaman untuk isian kata kunci dan menentukan apakah frekuensinya konsisten dengan situs lain yang dibuat khusus untuk menarik lalu lintas mesin pencari. Selain itu, halaman web yang besar terpotong, sehingga daftar kamus yang sangat besar tidak dapat diindeks pada satu halaman web. 

Teks tersembunyi atau tidak terlihat

Teks tersembunyi yang tidak terkait disamarkan dengan menjadikannya warna yang sama dengan latar belakang, menggunakan ukuran font kecil, atau menyembunyikannya dalam kode HTML seperti bagian "tanpa bingkai", atribut alt, DIV berukuran nol, dan bagian "tanpa skrip". Orang yang menyaring situs web berbendera merah secara manual untuk perusahaan mesin pencari mungkin memblokir seluruh situs web untuk sementara atau permanen karena memiliki teks yang tidak terlihat di beberapa halamannya. Namun, teks tersembunyi tidak selalu melakukan telusur tunak: teks juga dapat digunakan untuk meningkatkan aksesibilitas .[8]

Isian metatagar

Ini melibatkan pengulangan kata kunci dalam metatagar, dan menggunakan kata kunci meta yang tidak terkait dengan konten situs. Taktik ini tidak efektif. Google menyatakan bahwa mereka tidak menggunakan metatagar kata kunci dalam peringkat pencarian online pada bulan September 2009.[9]

Laman gerbang

Laman gerbang adalah halaman web berkualitas rendah yang dibuat dengan konten sangat sedikit, yang diisi dengan kata kunci dan frasa yang sangat mirip. Mereka dirancang untuk mendapatkan peringkat tinggi dalam hasil pencarian, namun tidak memberikan tujuan bagi pengunjung yang mencari informasi. Laman gerbang biasanya memiliki "klik di sini untuk masuk" pada halamannya; penerusan otomatis juga dapat digunakan untuk tujuan ini. Pada tahun 2006, Google mengusir produsen kendaraan BMW karena menggunakan "laman gerbangke situs perusahaan Jerman, BMW.de.[10]

Situs pengikis

Situs pengikis dibuat menggunakan berbagai program yang dirancang untuk "mengikis" halaman hasil mesin pencari atau sumber konten lain dan membuat "konten" untuk situs web. </link>[ <span title="This claim needs references to reliable sources. (October 2012)">kutipan diperlukan</span> ] Penyajian konten spesifik di situs-situs ini bersifat unik, namun hanyalah penggabungan konten yang diambil dari sumber lain, seringkali tanpa izin. Situs web tersebut umumnya penuh dengan iklan (seperti iklan bayar per klik ), atau mengarahkan pengguna ke situs lain. Bahkan mungkin saja situs pengikis mengungguli situs asli dalam hal informasi dan nama organisasinya.

Pemintalan artikel

Pemintalan artikel melibatkan penulisan ulang artikel yang sudah ada, dan bukan hanya mengambil konten dari situs lain, untuk menghindari hukuman yang dikenakan oleh mesin pencari untuk duplikat konten . Proses ini dilakukan oleh penulis sewaan </link> atau diotomatisasi menggunakan database tesaurus atau jaringan saraf tiruan

Mesin penerjemah

Mirip dengan pemintalan artikel, beberapa situs menggunakan terjemahan mesin untuk menerjemahkan kontennya dalam beberapa bahasa, tanpa penyuntingan manusia, sehingga menghasilkan teks yang tidak dapat dipahami namun terus diindeks oleh mesin telusur, sehingga menarik lalu lintas.

Telusur tunak tautan

Telusur tunak tautan didefinisikan sebagai tautan antar halaman yang muncul karena alasan selain manfaat. [11] Telusur tunak tautan memanfaatkan algoritme peringkat berbasis tautan, yang memberikan peringkat situs web lebih tinggi jika semakin banyak situs web berperingkat tinggi lainnya yang tertaut ke sana. Teknik ini juga bertujuan untuk mempengaruhi teknik pemeringkatan berbasis tautan lainnya seperti algoritma HITS .

Referensi

  1. ^ SearchEngineLand, Danny Sullivan's video explanation of Search Engine Spam, October 2008 Diarsipkan 2008-12-17 di Wayback Machine. "Google Search Central". 2023-02-23.  . Retrieved 2023-5-16.
  2. ^ "Word Spy - spamdexing" (definition), March 2003, webpage:WordSpy-spamdexing Diarsipkan 2014-07-18 di Wayback Machine..
  3. ^ a b Gyöngyi, Zoltán; Garcia-Molina, Hector (2005), "Web spam taxonomy" (PDF), Proceedings of the First International Workshop on Adversarial Information Retrieval on the Web (AIRWeb), 2005 in The 14th International World Wide Web Conference (WWW 2005) May 10, (Tue)-14 (Sat), 2005, Nippon Convention Center (Makuhari Messe), Chiba, Japan., New York, NY: ACM Press, ISBN 1-59593-046-9, diarsipkan dari versi asli (PDF) tanggal 2020-02-15, diakses tanggal 2007-10-05 
  4. ^ Zuze, Herbert; Weideman, Melius (2013-04-12). "Keyword stuffing and the big three search engines". Online Information Review (dalam bahasa Inggris). 37 (2): 268–286. doi:10.1108/OIR-11-2011-0193. ISSN 1468-4527. 
  5. ^ a b Ntoulas, Alexandros; Manasse, Mark; Najork, Marc; Fetterly, Dennis (2006), "Detecting Spam Web Pages through Content Analysis", The 15th International World Wide Web Conference (WWW 2006) May 23–26, 2006, Edinburgh, Scotland., New York, NY: ACM Press, ISBN 1-59593-323-9 
  6. ^ "SEO basics: what is black hat SEO?". IONOS Digitalguide (dalam bahasa Inggris). Diakses tanggal 2022-08-22. 
  7. ^ Smarty, Ann (2008-12-17). "What Is BlackHat SEO? 5 Definitions". Search Engine Journal. Diarsipkan dari versi asli tanggal 2012-06-21. Diakses tanggal 2012-07-05. 
  8. ^ Montti, Roger (2020-10-03). "Everything You Need to Know About Hidden Text & SEO". Search Engine Journal (dalam bahasa Inggris). Diarsipkan dari versi asli tanggal 2021-11-22. Diakses tanggal 2021-11-22. 
  9. ^ "Google does not use the keywords meta tag in web ranking". Google for Developers (dalam bahasa Inggris). Google. Diakses tanggal 21 September 2009. 
  10. ^ Segal, David (2011-02-13). "The Dirty Little Secrets of Search". The NY Times. Diarsipkan dari versi asli tanggal 2012-07-23. Diakses tanggal 2012-07-03. 
  11. ^ Davison, Brian (2000), "Recognizing Nepotistic Links on the Web" (PDF), AAAI-2000 workshop on Artificial Intelligence for Web Search, Boston: AAAI Press, hlm. 23–28, diarsipkan dari versi asli (PDF) tanggal 2007-04-18, diakses tanggal 2007-10-23