自学内容网 自学内容网

【计网】【计网】从零开始学习http协议 ---理解http重定向和请求方法

在这里插入图片描述

去光荣地受伤,
去勇敢地痊愈自己。
--- 简嫃 《水问》---

1 知识回顾

前面两篇文章中我们学习并实现了http协议下的请求与应答:

  • http请求包括四个部分:请求行 , 报头 , 空行 , 请求正文。请求行中的URL是客户端想要获取的资源,这是对于服务器来说最重要的部分,服务器后续通过URL在网络根目录中搜索对应的资源,然后通过应答报文返回。
  • http应答包括四个部分:状态行 , 报头 , 空行 , 应答正文。应答正文中包含从服务器返回的实际内容,如HTML页面、图片或其他数据。
  • 请求与应答中的报头都是用于传输请求和应答的一些基础信息,以键值对的形式储存。

http协议作为通信协议,必然要支持序列化与反序列化。我们需要做的是服务器的操作,只需要进行请求的反序列化和应答的序列化就可以了,请求的序列化和应答的反序列化是浏览器(客户端)需要考虑的。要做到序列化和反序列化需要按照请求和应答的结构,从字符串中读取分离出来,具体操作可以参考之前的文章:

  1. 【计网】从零开始学习http协议 — http的请求与应答
  2. 【计网】从零开始学习http协议 — 通过http实现客户端交互

实现了http协议中服务器的序列化和反序列化,接下来就可以加入一些资源来供客户端获取。
对于状态行的http版本与http状态码,我们也有了初步的了解:

  1. http版本:浏览器和服务端需要互相告诉各自的版本号,进而做到对应的处理!因为http协议会不断更新,不能保证对方是否更新协议!
  2. http状态码:状态码是服务器做出应答时根据数据处理的情况返回给浏览器。每个状态码对应一种情况!

2 认识网络重定向

状态码中3XX是代表重定向的:

状态码含义
301Moved Permanently 永久重定向
302Found 临时重定向
307Temporary Redirect 临时重定向资源到新位置
308Permanent Redirect 永久重定向资源到新位置

其中大部分使用301 302,307 308很少使用!我们介绍一下临时重定向和永久重定向。

首先,网络中的重定向和文件的重定向概念上比较类似。一般来说,我们访问对应的网址会直接找到对应的服务器进程。当这个服务器让课客户端重新进行请求另一个服务器时,此时就是重定向!

举个例子:学校南门口有一家非常好吃的饺子馆,小明经常去那里吃饭。后来因为道路施工问题,饺子馆搬到看学校北门口,并为了让老客户可以找到新地址,在原来门店贴上新地址。小明这天去了,看到了这个告示,就知道应该去北门口找到这家饺子馆,这就是重定向!以后小明在想去饺子馆应该去老地址还是新地址呢?
这就需要分两种情况:

  1. 如果饺子馆是临时搬到北门口,那么小明一个去原南门口的饺子馆看看,再来决定是否去北门口。
  2. 如果饺子馆是永久搬到北门口,那么下面不用犹豫,直接就去北门口就可以!

这里的两种情况就是临时重定向和永久重定向的区别:临时重定向只修改一次,下次客户端依然访问原网址。永久重定向会永久修改,下次客户端直接访问新地址!

实际应用中,也有实际的例子:

甲公司使用www.hello.com网址使用了很多年,积攒了很多用户。后来甲公司将公司网址改成了www.world.com
那么下一次老用户访问原网址时,对老客户进行重定向访问到新网址,并修改老客户中浏览器中的对应网址信息。这就是永久重定向!

永久重定向是给搜索引擎看的!每个搜索引擎都会抓取全国各个网站的网址信息,然后建立起键值对。每次搜索时就可以通过关键词搜索到对应的网站。这个抓取是不断进行的。当一个网站的网址永久更改时,在原网址设置重定向到新网址,客户端每次进到原网址都要进行一次重定向,每次都进行重定向就太麻烦了!所以浏览器发现永久重定向之后就会修改内部信息,下次就会直接访问到新网址!
在这里插入图片描述
我们可以在服务器中测试一下重定向!
我们在页面中加入一个测试重定向的链接,这个链接会请求/redir资源,这个资源实际上并不存在,只是用来进行是否进行重定向的判断依据!
在这里插入图片描述

这样点入链接之后,就会再次发送请求/redir这个资源,我们可以在处理时进行一个硬处理,当客户端访问这个资源时进行一个特殊处理:

if (hreq.Path() == "wwwroot/redir")
    {
        // 进行重定向
        LOG(DEBUG, "进行重定向!!!\n");
        std::string redir_path = "https://www.qq.com"; // 重定向的新地址
        resp.AddCode(302, _code_to_desc[302]);
        resp.AddHeader("Location", redir_path);
        // resp.AddBody(content);
    }
    else
    {
//...
}

这样进行序列化返回给浏览器之后,浏览器会自动识别,然后就跳转到新的网址中了!!!
在这里插入图片描述
非常好玩,这个现象就是重定向!!!

3 http请求方法

3.1 http常见请求方法

在http请求中有请求行,请求行中有一个参数:请求方法_method。这个请求方法到底是干什么用的呢?

http中有以下请求方法:

请求方法方法说明适配HTTP版本
GET请求指定的资源。一般用于信息查询,不应产生副作用。HTTP/1.0
POST向指定的资源提交数据进行处理请求(例如提交表单或上传文件)。HTTP/1.0
PUT向指定资源位置上传其最新内容。HTTP/1.0
DELETE请求服务器删除Request-URI所标识的资源。HTTP/1.0
HEAD类似于GET请求,但响应体不会返回,用于获取报头信息。HTTP/1.0
OPTIONS用于描述目标资源的通信选项。HTTP/1.1
TRACE回显服务器收到的请求,主要用于测试或诊断。HTTP/1.1
CONNECT用于将连接改为管道方式的代理服务器。HTTP/1.1
PATCH对资源进行部分修改。HTTP/1.1

其中最常见的就是GET方法和POST方法。 平时使用浏览器一般都是获取资源,就是进行GET。有时也会进行登录注册,这时会向服务器发送资源,就是进行POST!那么浏览器是如何进行呢?
我们可以在服务器中加入打印客户端请求方法,这样我们可以看到:
在这里插入图片描述
可以看到只要是获取资源都是使用的GET方法!

3.2 postman工具进行请求

那我们可以进行GET方法了,怎么进行POST方法呢?可以使用postman这个工具:

Postman提供了一个直观的界面来构建HTTP请求,包括设置请求头、请求体、认证等。
Postman允许用户发送各种HTTP请求(如GET, POST, PUT, DELETE等)到API端点,并检查响应。它支持测试脚本,可以自动验证响应数据。

我们通过postman快速创建http请求,使用POST方法发送。
在这里插入图片描述
这样服务器就得到了POST方法的请求。
在这里插入图片描述

GET方法不光可以获取数据,也可以向服务器发送数据。POST方法也可以向服务器推送数据!
我们可以在postman中加入两个键值对:
在这里插入图片描述
这样我们再次请求时,就会发现我们可以通过url向服务器进行传参了!
在这里插入图片描述

我们在使用POST方法试一试,POST方法需要再请求的正文中加入参数:
在这里插入图片描述
这样服务器会得到一个请求,这个请求正文中包含了传入的参数!
在这里插入图片描述
总结:

  • GET方法一般用来获取静态资源,也可以通过URL向服务器传递参数。
  • POST方法可以通过http请求的正文来进行参数的传递。
  • URL传参,参数的体量一定不大;正文传参,参数的体量可以很大!

3.3 处理GET和POST参数

但是在用户的实际使用中,用户不可能像POSTMAN一样可以手动选择请求方法,那么实际应用中,是通过前端的form表单完成GET和POST请求!

    <div>
        <!-- 默认就是GET -->
        <form action="/login" method="POST">
            用户名: <input type="text" name="username" value="."><br>
            密码: <input type="password" name="userpasswd" value=""><br>
            <input type="submit" value="提交">
        </form>
    </div>

这里最后使用POST方法,因为使用GET方法,会将参数加入到URL中,这样其他人可以就能够看到用户和密码了,这样可不行!
在这里插入图片描述
那么服务器如何处理参数呢?这个action="/login" 又是什么含义呢?

  • 当使用POST方法时,参数是写在正文中的,那么直接直接按照规则进行解析就可以了!
  • 如果使用GET方法,参数是加在URL中的。如果不做处理,会影响我们后续的很多操作,所以需要对URL进行处理!将真正的URL提取出来,并在正文中储存参数!
        // 解析参数 --- 忽略大小写进行比较
        if (strcasecmp(_method.c_str(), "GET") == 0)
        {
            //寻找 ?
            auto pos = _url.find(arg_sep);
            //包含?说明带参数
            if(pos != std::string::npos) 
            {
                _req_body_text = _url.substr(pos + arg_sep.size());
                _url.resize(pos);
            }
        }
    

这样不管是使用的什么方法传递的参数,我们都可以通过正文中获取参数了!

接下来我们来看action="/login",这个资源我们并不存在啊?这个action需要怎么处理呢?

我们在httpserver中加入一系列的服务名称与服务函数的哈希对应。

using func_t = std::function<HttpResponse(HttpRequest)>;

std::unordered_map<std::string , func_t> server_list;
    void InsertService(const std::string servicename , func_t f)
    {
    //加入网络根目录!
        std::string s = prefixpath + servicename;
        _server_list[s] = f;
    }

那么对于"/login"我们可以插入一个:

hserver.InsertService("/login" , login);

那么服务器可以在处理请求之后,进行特殊处理。识别出来action是"/login"时,就可以去执行func_t函数,然后可以返回对应的应答!

        if (hreq.Path() == "wwwroot/redir")
        {
            // 进行重定向
            LOG(DEBUG, "进行重定向!!!\n");
//...
        }
        else if (!hreq.GetRequestBody().empty())
        {
            if (IsServiceExists(hreq.Path()))
            {
                resp = _server_list[hreq.Path()](hreq);
            }
        }

这样就实现了对action的处理!!!所以http不光可以处理静态资源,也可以处理函数!

我们就可以设计一个处理login的方法:


HttpResponse Login(HttpRequest &req)
{
    HttpResponse resp;
    std::cout << "外部已经拿到了参数了: " << std::endl;
    req.GetRequestBody();
    std::cout << "####################### " << std::endl;
    resp.AddCode(200, "OK");
    resp.AddBody("<html><h1>result done!</h1></html>");

    // username=helloworld&userpasswd=123456
//可以进行很多种的操作!
    // 1. pipe
    // 2. dup2
    // 3. fork();
    // 4. 其他进程执行 -> exec* -> python, PHP, 甚至是Java!

    return resp;
}

这样我们能处理不同的action了:
在这里插入图片描述
通过这种方式,我们可以通过回调函数func_t进行可以进行很多操作了:

  1. pipe创建管道
  2. dup2进行重定向
  3. fork创建子进程
  4. exec*系列进行进程替换

因为C++语言处理业务并不擅长,但是c++处理底层十分快速!所以我们可以通过管道或者新的进程将数据交给python或者java这样的web语言来处理,然后在将数据返回给服务器,服务器处理好之后将http应答交给客户端!
这样服务器中各种语言的关系我们也就大概了解了!!!

我们可以来看一个浏览器的实例:
在这里插入图片描述
其中的https://cn.bing.com/search?q=helloworld,我们可以大致了解其中的原理:

  1. /s应该就是search服务,告诉服务器去执行搜索服务,这个服务不确定是什么语言进行的!
  2. 参数q=helloworld,是使用GET方法传给服务器的!也就是我们要搜索的内容!

通过F12查看页面信息我们也能找到对应的form表单:
在这里插入图片描述
这里的action就是/search


原文地址:https://blog.csdn.net/JLX_1/article/details/142764476

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!