Socket是網絡編程的一個抽象概念。通常我們用一個Socket表示“打開了一個網絡鏈接”,而打開一個Socket需要知道目標計算機的IP地址和端口號,再指定協議類型即可。
客戶端
大多數連接都是可靠的TCP連接。創建TCP連接時,主動發起連接的叫客戶端,被動響應連接的叫服務器。
舉個例子,當我們在瀏覽器中訪問新浪時,我們自己的計算機就是客戶端,瀏覽器會主動向新浪的服務器發起連接。如果一切順利,新浪的服務器接受了我們的連接,一個TCP連接就建立起來的,后面的通信就是發送網頁內容了。
所以,我們要創建一個基于TCP連接的Socket,可以這樣做:
# 導入socket庫:import socket# 創建一個socket:s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 建立連接:s.connect(('www.sina.com.cn', 80))
創建Socket時,AF_INET指定使用IPv4協議,如果要用更先進的IPv6,就指定為AF_INET6。SOCK_STREAM指定使用面向流的TCP協議,這樣,一個Socket對象就創建成功,但是還沒有建立連接。
客戶端要主動發起TCP連接,必須知道服務器的IP地址和端口號。新浪網站的IP地址可以用域名www.sina.com.cn自動轉換到IP地址,但是怎么知道新浪服務器的端口號呢?
答案是作為服務器,提供什么樣的服務,端口號就必須固定下來。由于我們想要訪問網頁,因此新浪提供網頁服務的服務器必須把端口號固定在80端口,因為80端口是Web服務的標準端口。其他服務都有對應的標準端口號,例如SMTP服務是25端口,FTP服務是21端口,等等。端口號小于1024的是Internet標準服務的端口,端口號大于1024的,可以任意使用。
因此,我們連接新浪服務器的代碼如下:
s.connect(('www.sina.com.cn', 80))
注意參數是一個tuple,包含地址和端口號。
建立TCP連接后,我們就可以向新浪服務器發送請求,要求返回首頁的內容:
# 發送數據:s.send('GET / HTTP/1.1/r/nHost: www.sina.com.cn/r/nConnection: close/r/n/r/n')
TCP連接創建的是雙向通道,雙方都可以同時給對方發數據。但是誰先發誰后發,怎么協調,要根據具體的協議來決定。例如,HTTP協議規定客戶端必須先發請求給服務器,服務器收到后才發數據給客戶端。
發送的文本格式必須符合HTTP標準,如果格式沒問題,接下來就可以接收新浪服務器返回的數據了:
# 接收數據:buffer = []while True: # 每次最多接收1k字節: d = s.recv(1024) if d: buffer.append(d) else: breakdata = ''.join(buffer)
接收數據時,調用recv(max)方法,一次最多接收指定的字節數,因此,在一個while循環中反復接收,直到recv()返回空數據,表示接收完畢,退出循環。
新聞熱點
疑難解答