RFC1783和RFC1808对URL是这样定义的,URL是对可以从因特网上用到的资源的位置和访问方法的一种简洁的表示。URL给资源的位置提供一种抽象的识别方法,并用这种方法给资源定位。只要能对资源定位,系统就可以对资源进行各种操作,如存取、更新、替换和查找其属性。
在这里,“资源”指因特网上可以被访问的任何对象,包括文件目录、文件、文档、图像、声音等以及因特网相连的任何形式的数据。另外“资源”还包括电子邮件的地址和USNET新闻组,也可以是USNET新闻组中的报文。在更多方面URL相当于一个指针,指向在因特网中的各种形式的文件。
URL 的一般形式
由以冒号隔开的两大部分组成,并且在 URL 中的字符对大写或小写没有要求。
URL 的一般形式是:<协议>://<主机>:<端口>/<路径>
由以冒号隔开的两大部分组成,并且在 URL 中的字符对大写或小写没有要求。
超文本传送协议 HTTP
为了使超文本的链接能够高效率地完成,需要用 HTTP 协议来传送一切必须的信息。
从层次的角度看,HTTP 是面向事务的(transaction-oriented)应用层协议,它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。
HTTP 的主要特点
HTTP 是面向事务的客户服务器协议。
HTTP 1.0 协议是无状态的(stateless)。
HTTP 协议本身也是无连接的,虽然它使用了面向连接的 TCP 向上提供的服务。
代理服务器(proxy server)
代理服务器(proxy server)又称为万维网高速缓存(Web cache),它代表浏览器发出 HTTP 请求。
万维网高速缓存把最近的一些请求和响应暂存在本地磁盘中。
当与暂时存放的请求相同的新请求到达时,万维网高速缓存就把暂存的响应发送出去,而不需要按 URL 的地址再去因特网访问该资源。
HTTP 的报文结构
HTTP 有两类报文:
请求报文——从客户向服务器发送请求报文。
响应报文——从服务器到客户的回答。
由于 HTTP 是面向正文的(text-oriented),因此在报文中的每一个字段都是一些 ASCII 码串,因而每个字段的长度都是不确定的。
在服务器上存放用户的信息
万维网站点使用 Cookie 来跟踪用户。
Cookie 表示在 HTTP 服务器和客户之间传递的状态信息。
使用 Cookie 的网站服务器为用户产生一个唯一的识别码。利用此识别码,网站就能够跟踪该用户在该网站的活动。
超文本标记语言 HTML
超文本标记语言 HTML 中的 Markup 的意思就是“设置标记”。
HTML 定义了许多用于排版的命令(即标签)。
HTML 把各种标签嵌入到万维网的页面中。这样就构成了所谓的 HTML 文档。HTML 文档是一种可以用任何文本编辑器创建的 ASCII 码文件。