本文主要内容

  • 服务器动态资源请求相关知识(WSGI)
  • python实现Web动态服务器示例

0x01 服务器动态资源请求

1.1 浏览器请求动态页面过程

1.2 WSGI

Web服务器网关接口(Python Web Server Gateway Interface,缩写为WSGI)是为Python语言定义的Web服务器和Web应用程序或框架之间的一种简单而通用的接口

怎么在你刚建立的Web服务器上运⾏⼀个Django应用和Flask应用,如何不做任何改变而适应不同的web架构呢?

在以前,选择Python web架构会受制于可用的web服务器 ,反之亦然。 如果架构和服务器可以协同⼯作,那就好了:

但有可能面对(或者曾有过)下⾯的问题,当要把⼀个服务器和⼀个架构结合起来时,却发现他们不是被设计成协同⼯作的:

那么,怎么可以不修改服务器和架构代码⽽确保可以在多个架构下运⾏web 服务器呢?答案就是Python Web Server Gateway Interface (或简称 WSGI,读作“wizgy”)。

  • WSGI允许开发者将选择web框架和web服务器分开。可以混合匹配web服务 器和web框架,选择⼀个适合的配对。⽐如,可以在Gunicorn或者 Nginx/uWSGI 或者Waitress上运⾏Django,Flask,或 Pyramid。真正的混合 匹配,得益于WSGI同时⽀持服务器和架构:

web服务器必须具备WSGI接⼝,所有的现代Python Web框架都已具备WSGI接口,它让你不对代码作修改就能使服务器和特点的web框架协同⼯作。
WSGI由web服务器支持,⽽web框架允许你选择适合自己的配对,但它同样对于服务器和框架开发者提供便利使他们可以专注于自己偏爱的领域和专长 而不至于相互牵制。其他语言也有类似接⼝:java有Servlet API,Ruby有 Rack。

1.3 定义WSGI接口

WSGI接⼝定义⾮常简单,它只要求Web开发者实现⼀个函数,就可以响应 HTTP请求。我们来看⼀个最简单的Web版本的“Hello World!”:

1
2
3
def apllication(environ, start_response):
start_reponse('200 ok',[('Content-Type','text/html')])
return 'Hello World!'

上⾯的pplication()函数就是符合WSGI标准的⼀个HTTP处理函数,它接收两个参数:

  • environ:一个包含所有HTTP请求信息的dict对象
  • start_response:一个发送HTTP响应的函数

整个application()函数本身没有涉及到任何解析HTTP的部分,也就是说,把底层web服务器解析部分和应用程序逻辑部分进行了分离,这样开发者就可以专⼼做⼀个领域了

不过,这个application()函数怎么调用?如果我们自己调用,两个参数environ和start_response我们没法提供,返回的str也没法发给浏览器。

所以application()函数必须由WSGI服务器来调用。有很多符合WSGI规范的服务器。而我们此时的web服务器项目的目的就是做一个可以解析静态网页还可以解析动态网页的服务器

0x02 python-Web动态服务器示例

2.1 本地Pycharm布置目录

2.2 web服务器代码(04_dynamic_web_server.py)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
# coding: utf-8
import socket
from multiprocessing import Process
import re
import sys

# 设置静态文件根目录
HTML_ROOT_DIR = "./html"

# 设置动态执行文件目录
WSGI_PYTHON_DIR = "./wsgipython"


class HTTPserver(object):
"""init"""
def __init__(self):
self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
self.server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)


def start(self):
self.server_socket.listen(128)
"""多进程处理请求"""
while True:
client_socket, client_address = self.server_socket.accept()
print("[%s,%s]用户连接上了" % client_address)
handle_client_process = Process(target=self.handle_client, args=(client_socket,))
handle_client_process.start()
client_socket.close()

def start_response(self,status,headers):
# 分析: start_response 处理响应的状态码和头部信息
"""
status = "200 OK"
headers = [
("Content-Type", "text/plain")
]
star
"""
response_headers = "HTTP/1.1 "+ status + "\r\n"
for header in headers:
response_headers += "%s: %s\r\n" % header
self.response_headers = response_headers

def handle_client(self, client_socket):
"""处理客户端请求"""
# 获取客户端数据
request_data = client_socket.recv(2048)
print("request data:",request_data)

# 处理请求数据
request_lines = request_data.splitlines()
for line in request_lines:
print(line)
# 解析请求报文
# "GET / HTTP/1.1"
request_start_line = request_lines[0]

# 提取用户请求的文件名
file_name = re.match(r"\w+ +(/[^ ]*)",request_start_line.decode("utf-8")).group(1)
# 提取用户请求的方法
method = re.match(r"(\w+) +/[^ ]* ", request_start_line.decode("utf-8")).group(1)

# "/ctime.py"
# "/sayhello.py"
# 判断是否为动态资源请求
if file_name.endswith(".py"):
# try使用提升容错率:也即访问的资源不存在时给出提示

try:
# __import__魔术方法,导入已经创建的py模块,类似import
# m这里以模块使用
m = __import__(file_name[1:-3])
except Exception:
# 使用self.response_headers为服务器添加属性
self.response_headers = "HTTP/1.1 404 Not Found\r\n"
response_body= "not found"
else:
# 字典表示请求的相关信息
env = {
"PATH_INFO":file_name,
"METHOD":method
}
response_body = m.application(env,self.start_response)

# response 服务器响应浏览器请求的数据
response = self.response_headers+ "\r\n" + response_body
else:
if "/" == file_name:
file_name= "/index.html"
# 打开文件
try:
file = open(HTML_ROOT_DIR+file_name,"rb")
except IOError:
# 构造响应数据
response_start_line = "HTTP/1.1 404 Not Found\r\n"
response_headers = "Server: My testserver\r\n"
response_body = "file is not found!"
else:
file_data = file.read()
file.close()
# 构造响应数据
response_start_line = "HTTP/1.1 200 0k\r\n"
response_headers = "Server: My testserver\r\n"
response_body = file_data.decode("utf-8")


response = response_start_line + response_headers+ "\r\n"+ response_body
print("response:",response)

# 向客户端发送数据
client_socket.send(bytes(response,"utf-8"))
# 关闭客户端连接
client_socket.close()

def bind(self,port):
self.server_socket.bind(("", port))


def main():
# 利用sys模块导入路径
sys.path.insert(1, WSGI_PYTHON_DIR)
http_server = HTTPserver()
http_server.bind(8000)
http_server.start()

if __name__ == "__main__":
main()

2.3 动态执行脚本(ctime.py)代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
# coding: utf-8
import time

# "/ctime.py?timezone=e8"
# "/ctime.py?timezone=e1"


def application(env, start_response):

# env.get("Method")
# env.get("PATH_INFO")
# env.get("QUERY_STRING")
"""
分析1:env保存的是http的请求,apllication 函数利用env相关信息进行处理
分析2: 浏览器动态请求的页面,再次通过服务器响应至浏览器端,状态码,和头部信息需在apllication中处理
分析3:start_response函数用来处理响应的状态status和响应头headers返回至dynamic_web_server服务器
分析4:return 返回内容,也即是响应体response_body内容
"""
status = "200 OK"
headers = [
("Content-Type", "text/plain")
]

start_response(status, headers)
return time.ctime()

2.4 执行流程图

  • 大概画了一下

2.5 测试