Question 1

Jenis URL apa yang terdeteksi oleh ekstraktor?

Accepted Answer

Ekstraktor mendeteksi URL HTTP dan HTTPS standar, URL dengan subdomain, URL dengan parameter query dan fragmen (#). URL dalam atribut HTML (href, src, action) juga terdeteksi. URL relatif (/halaman, ../gambar.jpg) mungkin tidak terdeteksi tanpa konteks domain dasar.

Question 2

Bisakah mengekstrak URL dari gambar atau PDF yang dipindai?

Accepted Answer

Tidak — alat ini hanya memproses teks biasa dan kode HTML. Gambar dan PDF yang dipindai pertama-tama perlu dikonversi ke teks menggunakan OCR (Optical Character Recognition). Adobe Acrobat, Google Drive, atau layanan OCR online dapat mengekstrak teks dari gambar.

Question 3

Apakah ekstraktor menghapus URL duplikat?

Accepted Answer

Ya — ekstraktor dapat menghapus URL duplikat untuk memberikan daftar URL unik. Opsi ini berguna ketika tautan yang sama muncul beberapa kali di halaman (menu navigasi, footer, body artikel).

Question 4

Bisakah mengekstrak URL dari email?

Accepted Answer

Ya — tempel konten teks email (bukan file .eml) dan ekstraktor akan mendeteksi semua URL. Klien email sering menyembunyikan URL aktual di balik teks tautan — untuk melihat URL yang sebenarnya, periksa kode sumber HTML email di klien email Anda.

Question 5

Apa perbedaan URL, URI, dan tautan?

Accepted Answer

URI (Uniform Resource Identifier) adalah istilah umum untuk pengenal sumber daya. URL (Uniform Resource Locator) adalah URI yang menyertakan lokasi (http://..., ftp://...). Tautan atau hyperlink adalah teks atau gambar yang dapat diklik dalam HTML yang merujuk ke URL. Dalam penggunaan sehari-hari, ketiganya sering digunakan secara bergantian.

Ekstraktor URL

Cara menggunakan Ekstraktor URL

Kapan menggunakan ekstraktor URL?

Ekstraktor browser vs grep vs skrip Python

MD5 vs SHA-1 vs SHA-256 vs bcrypt