Công cụ tìm kiếm so với Thư mục
Chính số lượng lớn thông tin có sẵn trên internet tạo ra một vấn đề cho người sử dụng internet. Nội dung đôi khi cũng có thể gây hiểu lầm và khó hiểu. Nếu người dùng đang tìm kiếm một chi tiết cụ thể, với lượng nội dung quá lớn này, việc tìm kiếm thông tin chính xác, lọc và chọn các tài nguyên hữu ích nhất là một nhiệm vụ đầy thách thức. Để giảm thiểu những phức tạp này và giúp người dùng dễ dàng tìm thấy tài nguyên hoặc nội dung được yêu cầu, các tài nguyên và nội dung của chúng được lập danh mục. Hai trong số các dịch vụ biên mục phổ biến nhất hiện có trên internet là các công cụ tìm kiếm và các thư mục web.
Thông tin thêm về Công cụ Tìm kiếm
Công cụ tìm kiếm là một ứng dụng web để tìm kiếm và định vị thông tin hoặc tài nguyên trên World Wide Web. Với sự phát triển của các nguồn trên www, việc lập chỉ mục các nội dung theo cách dễ dàng truy cập ngày càng trở nên khó khăn hơn. Giải pháp được đưa ra cho vấn đề này là công cụ tìm kiếm trên web.
Công cụ tìm kiếm trên web hoạt động theo ba bước sau. Thu thập thông tin web, Lập chỉ mục và tìm kiếm. Thu thập thông tin web là quá trình thu thập thông tin và dữ liệu có sẵn trên World Wide Web. Điều này thường được thực hiện với phần mềm tự động được gọi là trình thu thập thông tin web (còn được gọi là trình thu thập thông tin). Trình thu thập thông tin web là một chương trình thực thi một thuật toán để truy xuất thông tin mọi trang web và tự động đi theo các liên kết có liên quan. Thông tin truy xuất sẽ được lập chỉ mục và lưu trữ trong cơ sở dữ liệu cho các truy vấn sau này. Trình thu thập thông tin truy xuất và lập chỉ mục thông tin về nội dung của trang, chẳng hạn như các từ trong văn bản, URL cho các siêu liên kết và trường đặc biệt trong trang được gọi là thẻ meta.
Khi một yêu cầu hoặc truy vấn tìm kiếm được thực hiện cho một chi tiết cụ thể hoặc một trang trên web, thông qua trình duyệt web, công cụ tìm kiếm lấy thông tin liên quan từ cơ sở dữ liệu được lập chỉ mục và hiển thị kết quả dưới dạng danh sách các tài nguyên liên quan trên trình duyệt web.
Thông tin thêm về Thư mục Web
Thư mục web là một danh mục phân cấp của các trang web được xuất bản trên internet. Các trang web có thể gửi để lập danh mục cho các thư mục này, và chúng được liệt kê trong các trường liên quan trong thư mục. Thông thường các thư mục được duy trì bởi các biên tập viên và một trang web chỉ được liệt kê nếu trang web đó đáp ứng một tiêu chí nhất định đảm bảo tính xác thực và chất lượng của trang web. Ví dụ về các thư mục web phổ biến là Yahoo! Thư mục và Dự án Trực tiếp Mở. Một số thư mục tính phí để liệt kê trang web, trong khi một số danh sách miễn phí. Trong cả hai trường hợp, người dùng có quyền truy cập vào thư mục mà không phải trả bất kỳ khoản phí nào.
Công cụ tìm kiếm so với Thư mục
• Công cụ tìm kiếm là ứng dụng web hiển thị danh sách các tài nguyên có liên quan có sẵn bằng cách sử dụng cơ sở dữ liệu được tạo từ thông tin lập chỉ mục do trình thu thập thông tin web thu thập
• Thư mục web hiển thị danh sách các tài nguyên có liên quan bởi cơ sở dữ liệu được tạo bởi danh mục phân cấp các trang web được gửi để liệt kê, nơi các trang web được xem xét bởi các biên tập viên.
• Các công cụ tìm kiếm tự động thu thập thông tin về một trang web để lập chỉ mục, trong khi các thư mục Web yêu cầu gửi từ trang web để được liệt kê trong thư mục.
• Các trang web phải tuân thủ một tiêu chí nhất định để được liệt kê trong thư mục, để đảm bảo tiêu chuẩn và chất lượng, trong khi công cụ tìm kiếm sẽ tự động liệt kê bất kể chất lượng của nội dung. Mặc dù các công cụ tìm kiếm sử dụng các thuật toán đặc biệt để lọc và cung cấp thông tin hữu ích và phù hợp nhất cho người dùng.
• Một số thư mục tính phí cho danh sách trong thư mục, trong khi công cụ tìm kiếm không tính phí từ các nhà xuất bản.