专注SIP通讯产品与方案

万维网的URL

  要实现通过链接指针调阅指定的页面,首先必须定义页面的统一命名机制。该机制应指明三类信息:页面网络地址、页面文件名称、如何访问页面文件。URL就是由这三类信息组成的全球统一的页面名。它由三部分构成:
·访问协议名;
·贞曲所在主机的域名;
  ·唯 确定该贞面的本地名,通常就是页面文件在该主机上的路径名
  例如: http://www.njupt.edu.en/pnjupt/org/Department2/wE1-coIIE.htm指示的就是南京邮电学院二系的t页。它位于域名为www.njupt.edu.en的主机上,文件路径名为pnjupt/org/Department2/WE1come.htm,访问协议是http。在编写页面时,超链部分需给出两类信息:可点击的文字以及相应的URL。当用户点击此链时,浏览器从UR1、中取出域名,经由
DNS服务器得到对应的IP地址,然后建立TCP连接,在此连接上用
URL中指定的协议将文件名送给站点主机,就能得到所需的页面。
  URL支持的常用协议如表2.4所示:
常用URL访问协议
  由此可见,URL定义的访问机制是开放式的,不限于HTTP,允许用户采用任何协议去检索信息,这样,从原理上来说,只要有了Web浏览器就不需要其它协议专用的用户接口程序了。但是,它要求浏览器能处理各种协议,对于许多浏览器来说可能做不到这点,这时可采用另外一种方法,即设置代理服务器(proxyserver)。
  如下图所示:
  代理服务器相当于客户机和服务器之间的一个网关。它和客户机之间采用HITP通信,和服务器之间则采用FTP、Gopher等适配的协议通信。除了作为协议转换网关以外,代理服务器还可作为快速缓存(caching)。它将所有流经它的页面均保存在存储器中,暂存时间可设定,如24小时。当用户请求某页面时,代理服务器首先检查是否存有该页面,若有,则直接将缓存的页面送给用户。这样既加快速度又节省费用。此外,单位还可将代理服务器置于防火墙内,以控制用户对Internet的接入。
  尽管URL设计思想相当好,但是它也有-个固有的弱点,就是只能指向一个确定的主机。随着Web的大规模应用,希望一些经常被调用的页面能有多个副本置于不同的地点,以均衡网络的负荷。为此,IETF新定义了统一资源标识符(URI一一UniversalResourceIdentifier),它可视为广义的URL,支持同一资源分布在多个Web站点十。浏览器要调用该资源时,可以从最适当的站点取回。