Loading... 一个服务器返回的页面可能会有不同的编码,但我们常见的编码可能就两类。识别不同的编码有什么用呢?一方面是我们在提交 post 包的时候需要注意提交符合编码的包让服务器能正常识别(特别是含有中文还有一些符号的时候),另一方面是我们在获取到服务器的信息的时候,能够用正确的编码解析出来,否则就会看到乱码的内容。 常见的网页编码有两种。 第一种,utf-8(或 utf8 或 UTF8 之类的),这是一种包含了字母、字符、汉字等在一起的编码,在目前应用最为广泛,它的范围较广,可以使得网页基本用各种语言都不会出现乱码。 第二种,gbk(或叫 gb2312)是一种包含中文汉字的编码,部分网页会使用,我们直接获取到的页面如果是这种编码那就可以直接看到汉字了,如果看到的是前一种就需要转换成这一种才能看到正确的汉字。 网页的具体编码可以在协议头或网页源码的 `<head>` 部分看到。 **课后作业:** 本课没有作业。 **我相信,你一定会爱上它的!** 以下是我们的视频教程: **在线观看:** <div class="hideContent">该部分仅登录用户可见</div> **高清源文件下载:** <div class="hideContent">该部分仅登录用户可见</div> 感谢大家的收看,我们下期再见! 最后修改:2021 年 08 月 15 日 © 允许规范转载 赞 赠人玫瑰,手留余香