您的当前位置:首页正文

JavaScript中URL的相关内容介绍(附代码)

2020-11-27 来源:易榕旅网

现原形

利用 URL() 对象可以快速的把一个 url地址 打回原形:

脚本

const url = new URL('http://www.pushme.top/users?sort_by=asc#page=userlist')
console.log(url)
输出
{
 hash: "#page=userlist"
 host: "www.pushme.top"
 hostname: "www.pushme.top"
 href: "http://www.pushme.top/users?sort_by=asc#page=userlist"
 origin: "http://www.pushme.top"
 password: ""
 pathname: "/users"
 port: ""
 protocol: "http:"
 search: "?sort_by=asc"
 searchParams: URLSearchParams {}
 username: ""
}

没想到吧 小小的一段 url地址 里面居然有这么多属性,在这里主要会讲解的 hash 和 search。

推荐打开控制台把脚本运行一下,这样阅读的时候就不需要上下对照查看了。

host 和 hostname

眼尖的同学肯定发现了 host 和 hostname 居然一模一样这是为什么呢?

回忆一下开发经常在见到的 localhost:8080,这里出现了端口号 8080 而平时使用访问一些网站的时候却没有带上端口号。这是因为 url地址 会默认端口号为 80,所以你仔细看看会发现上面 port 的值为空。

而 host 和 hostname 的区别便是有 port 的时候 host 会包含端口号,而 hostname 不会包含。

protocol 和 origin

protocol 指的便是 协议 最常见的有 http 和 https,当然现在浏览器再不输入协议时会自动帮你加上,不过在 URL() 不带上协议可是会报错的哦。origin 则为 protocel 和 host 拼接组成。

search 和 searchParams

基础

?search=a 中 query 以第一个?开始至行尾或#结束。用于向后端传递一些数据,数据使用 & 进行分隔,值使用 = 分隔。通过一段代码来理解一下:

const query = 'id=1&sort=asc&hello=world';
// 对 & 分割取得数据对
const data = query.split('&').reduce((data,keyValue) => {
 const [ key, value ] = keyValue.split('=');
 return (data[key] = value, data);
}, {});

// 
输出 {id: "1", sort: "asc", hello: "world"} console.log(data);

这就是 query 最基础的数据对的组合方式,当然开头的四种 数组 的表达方式需要进行另外的处理,无外乎就是对 key 的收集 和 value 的判断。不过这部分基本上后端的框架都帮我们处理好了,前端也可以使用 qs、query-string、qss 等库来完成。

题外话:这几个库代码都挺少的,值得一读说不定有新收获。

加号与空格

每天使用的 百度 和 谷歌 中不知道大家有没有主要到这几个细节:

输入 https://www.baidu.com/s?wd=小二+pushmetop 搜索框中出现的是小二 pushmetop,地址栏中url地址的 + 神奇的变成了 空格。
输入 https://www.baidu.com/s?wd=小二 pushmetop 搜索框中出现的是小二 pushmetop,地址栏中url地址的 空格 的变成 %20。
输入 https://www.baidu.com/s?wd=小二%2Bpushmetop 搜索框中出现的是小二+pushmetop,地址栏中url地址的 %2B 的变成 +。

具体原因可以查看 维基百科 关于 保留字符的百分号编码 。

URL 编码

在 掘金 等网站点击链接都会快速的闪现类似 http://www.pushmetop.com?redirect=xxxxx 的 url地址,会发现 redirect 对应的重定向地址会是一堆夹带 % 的乱码这是为什么呢?

让我们假设需要跳转的链接是 www.test.com?hello=world&id=1,把整个链接拼接起来则为:

http://www.pushmetop.com?redirect=www.test.com?hello=world&id=1

根据一开始的定义 解析值预期值 完全不同了:

解析值
{
 "redirect": "www.test.com?hello=world",
 "id": "1"
}
预期值
{
 "redirect": "www.test.com?hello=world&id=1"
}

为了解决这个问题便诞生了 URL编码 来解决问题:

encodeURIComponent() 和 decodeURIComponent() 推荐使用。

encodeURI() 和 decodeURI() 对比前者不会对 "; / ? : @ & = + $ , #" 这些字符编码。

escape() 和 unescape() 不推荐使用。

例子

let redirect = 'www.test.com?hello=world&id=1';
redirect = encodeURIComponent(redirect);

let url = `http://www.pushmetop.com?redirect=${redirect}`;
url = new URL(url)

// 
输出: www.test.com?hello=world&id=1 console.log(url.searchParams.get('redirect'))

hash

#hash 中 fragment 以 # 为开始 行尾 为结束。在 回到顶部 中有提到过利用hash锚点来进行跳转,如果大家注意观察的话会发现 hash 的改变不会引起页面的刷新。

在 Angular.js、Vue Router 等库中,会利用在 html5 中提供了 history 的一系列操作,来帮助我们不刷新页面管理 url。但是在一些旧的浏览器上并不兼容时,会利用 hash 不会主动触发浏览器 reload 的特性来修改 location.hash 来管理路由。 当然 hash 的另外一个特点是可以被保存为书签,也是一大优点。

hash 的小妙用也可以像 query 那样利用 & 和 = 来存取数据,当然你也可以定制属于你的规则。

href 和 pathname

href 为整个 url地址。而 pathname 属性包含 URL 的整个路径部分。它跟在 host (包括 port)后面,排在 query 或 hash 组成部分的前面且被 ASCII 问号(?)或哈希字符(#)分隔。

username 和 password

username 和 password 在日常使用中很少用,它们可以合称为 auth。该字符串跟在 protocol 和双斜杠(如果有)的后面,排在 host 部分的前面且被一个 ASCII 的 at 符号(@)分隔:

http://username:password@www.pushme.top/test/blah?something=123

结尾

本来只是想讨论 hash 和 search ,结果全都过一遍,今天就辛苦大家了。

本篇文章到这里就已经全部结束了,更多其他精彩内容可以关注PHP中文网的的JavaScript教程视频栏目!

显示全文