12 công cụ tìm kiếm giúp bạn khám phá Web ẩn
Không phải mọi thứ trên internet đều sẽ hiển thị trong danh sách kết quả tìm kiếm của Google hoặc Bing; có rất nhiều thứ mà người dùng bình thường như chúng ta không thể truy cập. Để khám phá web ẩn, bạn cần sử dụng các công cụ tìm kiếm chuyên dụng. Vậy nên trong bài viết này, mình sẽ giới thiệu cho các bạn 12 công cụ tìm kiếm chuyên dụng tốt nhất để khám phá web ẩn.
Web ẩn là gì?
Trước khi bắt đầu, chúng ta hãy tìm hiểu “web ẩn” là gì? Đơn giản, đó là một thuật ngữ chung cho những nội dung không được hiển thị trong kết quả tìm kiếm của các công cụ như Google, Bing,…
Mặc dù không có dữ liệu chính thức, nhưng hầu hết các chuyên gia đồng ý rằng web ẩn lớn hơn nhiều lần so với web nổi. Chỉ riêng Google, Amazon, Microsoft và Facebook đã lưu trữ hơn 1.200 petabyte dữ liệu, vậy thì chắc bạn cũng biết web ẩn lớn như nào rồi nhỉ.
Nội dung trên web ẩn có thể được chia đại khái thành deep web và dark web.
Deep web
Deep web thường cần một số hình thức công khai để truy cập. Ví dụ: cơ sở dữ liệu thư viện, hộp thư đến email, hồ sơ cá nhân (tài chính, học tập, sức khỏe và pháp lý), ổ đĩa lưu trữ đám mây, mạng nội bộ của công ty,..
Bạn có thể tìm hiểu kỹ hơn về deep web cũng như cách truy cập deep web tại đây.
Dark web
Dark web là một phần phụ của deep web. Bạn cần sử dụng trình duyệt dark web chuyên dụng (chẳng hạn như Tor) để xem nội dung. Nó ẩn danh hơn web thông thường và do đó thường là nơi diễn ra các hoạt động bất hợp pháp như buôn bán ma túy và vũ khí.
Bạn có thể tìm hiểu kỹ hơn về dark web cũng như cách truy cập dark web tại đây.
12 công cụ tìm kiếm sâu tốt nhất để khám phá web ẩn
1. Pipl
Pipl tự coi mình là công cụ tìm kiếm người lớn nhất thế giới. Không giống như Google, Pipl có thể tương tác với cơ sở dữ liệu có thể tìm kiếm, danh bạ thành viên, hồ sơ tòa án và các nội dung tìm kiếm trên internet khác để cung cấp cho bạn thông tin nhanh chi tiết về một người nào đó.
2. The Wayback Machine
Các công cụ tìm kiếm thông thường chỉ cung cấp kết quả từ các phiên bản gần đây nhất của trang web có sẵn.
Wayback Machine thì khác. Nó có các bản sao của hơn 361 tỷ trang web trên các máy chủ của mình, cho phép bạn tìm kiếm nội dung không còn có sẵn trên trang web hiển tại.
3. The WWW Virtual Library
WWW Virtual Library là danh mục lâu đời nhất trên web. Nó được tạo ra bởi Tim Berners-Lee, người tạo ra World Wide Web, vào năm 1991.
Các tình nguyện viên biên soạn danh sách các liên kết bằng tay, do đó tạo ra danh sách chất lượng cao về nội dung deep web trên hàng chục danh mục.
4. DuckDuckGo
DuckDuckGo nổi tiếng là một công cụ tìm kiếm riêng cho web nổi, nhưng bạn có biết công cụ này cũng cung cấp một trang web cho phép bạn khám phá dark web không?
Ngay cả công cụ tìm kiếm thông thường cũng cung cấp nhiều nội dung deep web hơn Google. Nó tập hợp các kết quả từ hơn 500 công cụ tìm kiếm độc lập để tìm ra kết quả cuối cùng. Nếu bạn ghép công cụ DuckDuckGo thông thường với phiên bản .onion, bạn có thể thực hiện tìm kiếm toàn bộ trang web.
Trang web onion có thể được tìm thấy tại http://3g2upl4pq6kufc4m.onion/.
5. USA.gov
Số lượng nội dung của USA.gov rất ấn tượng. Đây là một cổng thông tin cho tất cả các tài liệu công cộng mà bạn cần trên mọi cơ quan liên bang và chính phủ.
Bạn cũng sẽ tìm thấy thông tin về việc làm của chính phủ, các khoản vay, trợ cấp, thuế và nhiều thứ khác. Hầu hết thông tin trên trang web sẽ không xuất hiện trên Google.
6. Directory of Open Access Journals
Directory of Open Access Journals là một công cụ tìm kiếm sâu trên internet cung cấp quyền truy cập vào các bài báo học thuật. Giấy tờ có sẵn cho bất cứ ai mà không tính phí.
Kho tài liệu hiện tại có gần 10.000 tạp chí với 2,5 triệu bài báo về mọi chủ đề. Google Scholar có thể truy cập một số thông tin, nhưng mình nghĩ rằng DOAJ là một công cụ nghiên cứu tốt hơn.
7. notEvil Dark Web
Nếu bạn đang tìm kiếm một công cụ tìm kiếm dark web, hãy thử notEvil Dark Web. Trang web có tên miền .onion, vì vậy không thể truy cập thông qua trình duyệt web tiêu chuẩn. Để truy cập, hãy mở một trình duyệt deep web như Tor và dán hss3uro2hsxfogfq.onion vào thanh địa chỉ.
Nó có một cơ sở dữ liệu gồm hơn 32 triệu trang dark web để tìm kiếm.
8. Elephind
Elephind nhằm mục đích cung cấp một cổng thông tin duy nhất cho tất cả các tờ báo lịch sử trên thế giới. Đây là một nguồn tài liệu tuyệt vời cho các nhà nghiên cứu — đặc biệt là các nhà sử học và sinh viên.
Nhiều tờ báo trên trang này là độc quyền trên deep web; chúng sẽ không hiển thị trên Google. Tại thời điểm viết bài, 3,6 triệu tờ báo hiện có sẵn trên trang web đó.
9. Voice of the Shuttle
Đối với bất kỳ ai quan tâm đến khoa học nhân văn, Voice of the Shuttle là một nguồn tài nguyên rất cần thiết. Trang web hoạt động vào năm 1994 và ngày nay tự hào là một trong những bộ sưu tập nội dung deep web được quản lý tốt nhất.
Có hơn 70 trang liên kết được chú thích bao gồm mọi thứ từ kiến trúc đến triết học.
10. Ahmia
Ahmia là một công cụ tìm kiếm dark web. Nhưng hơi khác chút vì nó là một trong số ít các công cụ tìm kiếm dark web có sẵn trên web thông thường.
Tất nhiên, mọi liên kết và kết quả sẽ không thể mở được trừ khi bạn đã cài đặt trình duyệt Tor trên máy tính của mình. Tuy nhiên, đó vẫn là một cách tuyệt vời để thưởng thức những gì có sẵn trên dark web mà không phải chịu những rủi ro khi sử dụng dark web.
11. WorldCat
Công cụ tìm kiếm sâu này có hai tỷ mục danh sách từ các thư viện trên khắp thế giới. Bao gồm 15.637 thư viện ở 107 quốc gia tham gia vào hợp tác toàn cầu OCLC. Nó được vận hành bởi OCLC, Inc. Các thư viện thành viên đăng ký cùng duy trì cơ sở dữ liệu của WorldCat, cơ sở dữ liệu thư mục lớn nhất thế giới.
12. Project Gutenberg
Project Gutenberg cung cấp hơn 58.000 sách điện tử miễn phí cho bạn xem và tải xuống thoải mái.
Đáng buồn thay, một trong những công cụ tìm kiếm sâu nổi tiếng nhất trong quá khứ, Deeppeep, không còn tồn tại, nhưng tất cả các trang web trong bài viết có thể giúp bạn thoải mái khám phá web ẩn rồi.