用户代理用户代理(英語:user agent)在计算机科学中指的是代表使用者行为的程序(软件代理程序)。例如,网页浏览器就是一个“帮助用户获取、渲染网页内容并与之交互”的用户代理;电子邮件阅读器也可以称作邮件代理。而在会话发起协议(SIP)中,用户代理指代的是一个通信会话的所有两个终端[1]。 在很多场合,用户代理作为一个主从式架构的分布式计算系统中的通信所用网络传输协议的客户端而行为。特别是在超文本传输协议中指定要求发起请求的客户端软件要使用一个“User-Agent”请求表头,即使在客户端不由用户操纵的时候。SIP协议(基于HTTP)沿用了这一用法。 用户代理识别當一個軟體在一個网络协议進行操作時,它通常向它的operating peer提交一个特定的字符串來標示自己,該字符串通常包含了其應用程式類型、操作系统、软件供应商……等等,有時還會包含软件修订版本等資訊。在HTTP、SIP以及SMTP/NNTP[2]协议中,这个识别是通过user-agent的头字段传送的。 在HTTP中,User-Agent字符串通常被用於内容协商,而原始服务器为该响应选择适当的内容或操作参数。例如,User-Agent字符串可能被网络服务器用以基于特定版本的客户端软件的已知功能选择适当的变体。 通过使用robots.txt文件的可以設定网络抓取工具對網站的部分訪問與否,而其設定標準之一就是用户代理字符串。換句話說,藉由robots.txt文件的設定,可以讓網站不能被特定的瀏覽器訪問。 可能隐私问题与许多其它HTTP请求标头一样,在User-Agent字符串内的信息构成了客户端发送给服务器的信息的一部分,由于该字符串可以因用户不同而有很大程度的差异。[3] 格式根據Hypertext Transfer Protocol (HTTP/1.1): Semantics and Content. (页面存档备份,存于互联网档案馆)第5.5.3章和Hypertext Transfer Protocol -- HTTP/1.1 (页面存档备份,存于互联网档案馆)第14.43章,用户代理的格式如下:
例如你的产品叫做WikiBrowser,你的用户代理字符串就可能是WikiBrowser/1.0 Gecko/1.0。「最重要的」产品组件被最先列出。这个字符串的部分如下所示:
但不幸的是,在浏览器大战期间,很多网络服务器的配置只给被识别为某些版本的Mozilla的客户端发送需要高级功能的网页。 因此,为获取更好的网页,绝大多数网页浏览器使用的User-Agent值如下:
例如,iPad上的Safari使用的就是下述:
这个字符串的组成如下:
网页浏览器用户代理字符串的演变历史现时网页浏览器用户代理字符串的复杂性,源于网页浏览器历代更新和竞争下的结果: 最早出现的网页浏览器是伊利诺伊大学国家超级计算中心(NCSA)的Mosaic,使用的用户代理字符串类似为: 网景通讯公司招募了Mosaic的主要开发人员,开发出新的网页浏览器以挑战取代Mosaic,其开发代号为Mozilla,意为“Mosaic杀手(Mosaic Killa)”,由于避免与Mosaic产生版权纠纷,最终产品名为Netscape Navigator(网景导航者),使用的用户代理字符串类似为: 之后微软也开发出Internet Explorer意图挑战取代Netscape Navigator,同样实现了Netscape Navigator所拥有的先进特性,但由于服务器的用户代理嗅探机制,为了尽快跟随对手,所以使用了包含“ 后来网景将Netscape Navigator开源化,诞生出Mozilla组织,开发出新的开源浏览器渲染引擎Gecko及对应的浏览器产品Mozilla FireFox,以在第二次浏览器大战中挑战Internet Explorer的地位,使用的用户代理字符串类似于: 特例的是,Opera同时使用标识兼容于多个渲染引擎(或网页浏览器)和自己独有渲染引擎Presto的用户代理字符串,类似于: 用户代理欺骗各种网页浏览器的流行程度在整个Web的历史上一直在变化,而且有些网站不是根据万维网联盟(W3C)或者互联网工程任务组(IETF)所制定的统一标准的方式設計,而是設計只能在特定浏览器下顯示。网站通常探测浏览器版本的代码,根據用户代理調整其页面设计。換句話說,在流行程度不高的瀏覽器上,即使它们可能有能力处理它,不會收到較複雜的內容,更甚者,在极端情况下,拒绝全部内容[5]。因此,有很多浏览器有伪装或欺骗其标识字符串的功能,讓伺服器發送不同的內容。例如,Android上的浏览器识别自己为Safari以增加兼容性。[6] 其它HTTP客户端程序,如下载管理器和离线网页浏览器,通常有能力更改用户代理字符串。 在网页設計師中流行“任何浏览器可见”[7],鼓励开发者设计网页時,能讓網頁在任何瀏覽器都能有一樣好的瀏覽結果。 用户代理欺骗的结果之一是可能令收集到的网页浏览器的使用分布不准确。需要注意,用户代理欺骗可能违反某些法律法规、损害他人利益[8]。 用户代理嗅探用户代理嗅探(User Agent sniffing)指的是网站在特定用户代理下查看时展示不同内容的技术。在互联网上,这将导致在特定浏览器下浏览某些网页时显示的是截然不同的站点。这方面一个有用的例子是Microsoft Exchange Server 2003的Outlook Web Access功能。当在Internet Explorer 6(或更新版本)查看时,比起在任何更旧浏览器中的相同页面,会有更多功能被显示,因为旧的浏览器无法渲染相同内容[來源請求]。用户代理嗅探大多被认为是不好的做法,因为它鼓励浏览器特定的设计而且由于无法识别的用户代理标识而惩罚新的浏览器。相反,W3C推荐创建标准的HTML标记,[9]允许在尽可能多的浏览器下正确的渲染,且测试特定的浏览器特性而不是特定浏览器版本或品牌。[10] 专门针对手机的Web站点,如NTT DOCOMO的i-mode或者沃达丰的Vodafone live!门户网站,通常严重依赖于用户代理嗅探,由于移动浏览器通常相互之间差异巨大。在最近几年中,[何时?]在移动浏览领域已作出了很多发展,然而很多并不拥有这些新技术的旧的手机仍然在被广泛使用。所以,手机门户网站经常依赖用以浏览它们的手机种类而产生而产生截然不同的标记代码。这些差异可以很小,如,调整某些图像的大小以适应更小的屏幕,或者相当大,如,以WML渲染网页而不是XHTML。 加密强度表示法在美国创建的网页浏览器,如Netscape Navigator和Internet Explorer,在用户代理字符串中使用字母U, I和N以指定加密强度。直至1996年,美国政府允许了通过长于40位密钥的加密被出口为止,供应商推出不同浏览器版本,各自具有不同加密强度。“U”代表美国(为具有128-位加密的版本);“I”代表国际—浏览器具有40-位加密且可以在全世界任何地方被使用—而“N”代表(事实上)“没有”(没有加密)。[11]随着出口限制的解除,绝大多数供应商支持了256-位加密。 参见参考
外部連結
|