Python An ninh mạng – Bài 2: Thư viện Requests

Tiếp nối bài viết trước đó là tạo port scanner (trình quét cổng) bằng python. Trong bài viết này, mình sẽ hướng dẫn các bạn làm quen với thư viện requests trong python, và cách ứng dụng thư viện đó trong an ninh mạng nhé.

Thư viện Requests

Đối phó với các requests HTTP không phải là một nhiệm vụ dễ dàng trong bất kỳ ngôn ngữ lập trình nào. Nếu khi nói về Python, nó đi kèm với hai thư viện tích hợp sẵn là urllib và urllib2, để xử lý các hoạt động liên quan đến HTTP. Cả hai thư viện đi kèm này đều có một tập hợp các hàm (chức năng) khác nhau và nhiều khi cần được sử dụng cùng nhau. Hạn chế chính của việc sử dụng urllib là nó dễ gây nhầm lẫn (một số methods có sẵn trong cả urllib, urllib2), tài liệu không rõ ràng và chúng ta cần viết rất nhiều code để thực hiện một yêu cầu HTTP đơn giản.

Để làm cho công việc đơn giản hơn, một thư viện bên thứ ba dễ sử dụng đã ra đời, được gọi là requests, có sẵn và hầu hết các nhà phát triển đều thích sử dụng nó để thay thế urllib/urllib2. Nó là một thư viện HTTP của Apache2 và được cung cấp bởi urllib3 và httplib.

Cài đặt

Vì trong bài này sử dụng python3, nên mình sẽ sử dụng pip3 để cài đặt các thư viện của bên thứ ba.

Nhập lệnh sau vào Terminal:

sudo pip3 install requests

Lệnh pip đó sẽ cài đặt thư viện request trên hệ thống của bạn.

Các khái niệm cơ bản về requests

Để bắt đầu sử dụng thư viện request của python, trước tiên bạn cần phải import nó. Sau đây là các lệnh sẽ được sử dụng để tạo một chương trình thu thập dữ liệu từ một trang web hoặc API. Nhưng trước tiên, bạn cần đọc bài viết này nắm rõ về cơ chế hoạt động của HTTP đã.

request.get(url): Lệnh này sẽ thực hiện request GET tới trang web.
request.post(url, data): Lệnh này sẽ thực hiện request POST đến URL và dữ liệu của nội dung bài viết có thể được chuyển sang dạng dictionary.

Lưu ý: Các phương thức request khác sẽ được thực hiện theo cách tương tự như request.head, request.put,…

Để dễ hiểu, chúng ta hãy lấy một ví dụ về đối tượng request:

>>>import requests
>>>r = requests.get("https://google.com")

r.status_code: Lệnh này sẽ trả về mã phản hồi đã nhận được từ request như 200, 404, 301,…
r.text: Lệnh này sẽ trả về dữ liệu bạn đã nhận được từ một trang web.
r.json: Lệnh này sẽ lấy dữ liệu đã phản hồi từ web dưới dạng dictionary.

Đối số cho các phương thức request:

timeout: Lệnh này được sử dụng để đặt thời gian chờ cho một request.
allow_redirects: Lệnh này được sử dụng để chỉ định chuyển hướng có thể được phép hoặc không như allow_redirects = True sẽ cho phép các request chuyển hướng.
r.encoding: Lệnh này sẽ hiển thị dạng mã hóa của dữ liệu nhận được.
cookie: Lệnh này sẽ chuyển cookie đến session request.
headers: Lệnh này sẽ sử dụng để cung cấp header cho session request.

Bài tập 1: Tra cứu IP

Áp dụng những kiến thức trên, chúng ta sẽ thực hiện một request đơn giản tới API tra cứu IP để thu thập thông tin cho mục tiêu của chúng ta.

Lưu ý: Đây sẽ là một request rất cơ bản, nhưng dù sao nó cũng sẽ giúp bạn hiểu cách thu thập dữ liệu bằng Python. Mình đang sử dụng API này để nhận thông tin chung về địa chỉ IP.

import requests
import json  # Thư viện dùng để định dạng dữ liệu nhận được
def iplookup(public_ip):
    r = requests.get("http://ip-api.com/json/"+public_ip) 
    if r.status_code == 200: # Nếu thành công
        data = json.loads(r.text) # Chuyển dữ liệu nhận được vào json
        for key, value in (data).items(): # Định dạng dữ liệu json sang dictionary
            print("{}:{}".format(key, value))
    else:  # If error occurs
        print("Error Occured while making request")

if __name__ == "__main__":
    try:
        ip = input("Enter IP: ")
        iplookup(ip)
    except:
        print("Error Occured!")

Cách hoạt động

Trên dòng đầu tiên và thứ hai, chúng ta import 2 thư viện là requests và json. Sau đó, chúng ta tạo một hàm có tên iplookup, chứa tham số public_ip. Tiếp theo, chúng ta gửi request tới API và xem nó có thành công hay không thông qua r.status_code. Chuyển dữ liệu nhận được sang định dạng json và dictionary rồi in ra Terminal. Mình đã thêm try...except để xử lý bất kỳ lỗi nào có thể xảy ra.

Bài tập 2: Chặn thư mục

Bây giờ, chúng ta hãy sử dụng một công cụ phức tạp hơn, nhưng rất hữu ích, một công cụ chặn thư mục. Nhưng trước khi tiếp tục, mình sẽ giải thích cho cac bạn cách đọc và ghi file bằng Python.

Xử lý file: Đọc và ghi

Chúng ta cần đọc các tệp để thực hiện việc chặn thư mục bằng cách sử dụng dictionary attack. Trong python, chúng ta sử dụng hàm open là một hàm tích hợp trả về một đối tượng tệp và có thể được sử dụng để mở tệp theo nhiều cách khác nhau như đọc, ghi và nối thêm.

Ví dụ:

#!/usr/bin/python3

f = open("new.txt", "r") # Mở file ở chế độ đọc
print(f.read()) # Đọc nội dung file
new = open("new1.txt","w") # Mở file ở chế độ đọc ghi
data = f.read() 
new.write(data) # Ghi dữ liệu vào file new1.txt
new.close() # Đóng file

Chúng ta sử dụng hàm open có 2 tham số là đường dẫn của file và chế độ mở file. Trong ví dụ trên, file.txt là đường dẫn tệp, còn r là chế độ đọc và sau đó mở tệp new1.txt để ghi dữ liệu.

Các chế độ tệp khác nhau:

r: Chế độ đọc.
w: Chế độ ghi.
a: Chế độ nối (Khi mở file, vị trí con trỏ sẽ luôn ở cuối file).
r+: Chế độ đọc và ghi.

Lưu ý: Việc thêm b vào một chế độ sẽ mở tệp ở chế độ hoạt động nhị phân, tức là tất cả nội dung của tệp sẽ được coi là đối tượng byte như f = open ("new.txt", "rb") sẽ đọc tệp ở dạng nhị phân.

import requests

def dirb(url, dict):
    try:
        wordlist = open(dict,"rb")
        for path in wordlist.readlines():
            path = path.strip().decode("utf-8")
            urlpath = url+"/"+path
            r = requests.get(urlpath)
            if r.status_code != 404:
                print("{} -> {}".format(r.status_code, urlpath))
    except: # Catching exceptions
        print("Error Occured!")

if __name__ == "__main__":
    dirb("http://10.0.0.210", "all.txt")

Cách hoạt động

Chúng ta đã tạo một hàm có tên là dirb với các tham số là url và dict, đây sẽ là tệp chứa danh sách thư mục để brute force trên trang web. Tiếp theo, mình cũng không quên sử dụng try...except. Sau đó, mình mở tệp dict bằng cách sử dụng readlines và đọc danh sách các từ có trong file, rồi tách chuỗi và giải mã, nối dữ liệ vào các url được chỉ định của mình, sau đó thêm các url và đường dẫn cùng với “/”. Cuối cùng, thực hiện request GET tới url đã tạo và in đầu ra của request miễn là mã phản hồi không bằng 404 (có nghĩa là “Not Found”).

Mình sẽ sử dụng tệp lệnh này để hack một máy chủ trên TryHackMe MrRobotCTF và đây là kết quả:

robin@oracle:~$ python3 temp.py
200 -> http://10.0.0.210/admin
403 -> http://10.0.0.210/.htaccess
200 -> http://10.0.0.210/readme.html
200 -> http://10.0.0.210/image
--snip--

Bạn cũng có thể triển khai máy chủ MrRobot và sử dụng tập lệnh này để lấy các thư mục của trang web.

Tổng kết

Bài viết này sẽ cung cấp cho bạn đủ ý tưởng và kiến thức để tạo các công cụ của riêng bạn bằng Python3. Nhưng trong dự án thứ hai, bạn có thể thấy rằng chương trình chạy hơi lâu. Để giải quyết vấn đề đó, chúng ta có thể sử dụng đa luồng. Mình chưa thêm tính năng đó vào vì nó sẽ yêu cầu thêm một số thư viện và kiến thức khác nhau. Ngoài ra, bạn cũng có thể xem thêm nhiều bài về python tại đây.

Đánh giá post

Thư viện Requests

Cài đặt

Các khái niệm cơ bản về requests

Bài tập 1: Tra cứu IP

Cách hoạt động

Bài tập 2<img decoding="async" src="https://rathuuich.com/wp-content/uploads/2024/03/python-requests-network.jpg" alt="python requests network" width="720" height="405" title="Python An ninh mạng - Bài 2: Thư viện Requests 7">: Chặn thư mục

Xử lý file: Đọc và ghi

Cách hoạt động

Tổng kết

Bài tập 2: Chặn thư mục