title.JPG (8872 bytes)
 

第二章 HTML 4.0简介

内容
  1. 什么是WWW?
    1. 什么是URI
    2. 片段标志符
    3. 相对URI
  2. 什么是HTML?
    1. HTML历史简介
  3. HTML 4.0
    1. 国际化
    2. 可用性
    3. 表格
    4. 组件文档
    5. 样式表
    6. 脚本
    7. 打印
  4. 用HTML 4.0做文档
    1. 分离结构和表现
    2. 考虑对Web的一般可用性
    3. 用增加的渲染做用户代理  

2.1 什么是WWW?

World Wide Web (Web)是信息资源的网络。Web依赖三种机制保证这些资源可被
世界范围内的访问者访问:

  1. 在Web上定位资源的统一命名规则,如URI。
  2. 通过Web访问命名资源的协议,如HTTP。
  3. 在资源间轻松导航的超文本,如HTML。

读过此规范后就会明白这三种机制之间的联系。

2.1.1 什么是URI

Web上可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通过通
用资源标志符(Universal Resource Identifier, 简称"URI")进行定位。

URI一般由三部分组成:

  1. 访问资源的命名机制。
  2. 存放资源的主机名。
  3. 资源自身的名称,由路径表示。

考虑下面的URI,它表示了当前的HTML 4.0规范:

   http://www.webmonkey.com.cn/html/html40/

这个URI是这样的:这是一个可通过HTTP协议访问的资源,位于主
机www.webmonkey.com.cn上,通过路径“/html/html40”访问。在HTML文档中
其它资源包括"mailto"(收发email)和"ftp"(FTP访问)。

这是URI的另一个例子,指向一个用户的邮箱:

<A href="mailto:joe@someplace.com">Joe Cool</A>

注:大多数读者可能熟悉"URL",而不是URI。URL是RUI命名机制的一个子集。

2.1.2 片段标志符

有的URI指向一个资源的内部。 这种URI以"#"结束,并跟着一个anchor标志
符(称为片段标志符)。例如,下面是一个指向section_2的URI:

http://somesite.com/html/top.htm#section_2

2.1.3 相对URI

相对URI 不包含任何命名规范信息。它的路径通常指同一台机器上的资源。相
对URI可能含有相对路径(如,“..”表示上一层路径),还可能包含片段标
志符

为了说明相对URI,假设我们有一个基本的URI
"http://www.acme.com/support/intro.htm"。下面的链接中使用了相对URI:

   <A href="suppliers.htm">Suppliers</A>

它扩展成完全的URI就是 "http://www.acme.com/support/suppliers.htm"
下面是一个图像的相对URI:

   <IMG src="../icons/logo.gif" alt="logo">

它扩展成完全的URI就是 "http://www.acme.com/icons/logo.gif"

在HTML中,URI被用来:

  • 链接到另一个文档或资源(参看A和LINK元素)。
  • 链接到一个外部样式表或脚本(参看LINK和SCRIPT元素)。
  • 在页内包含图像、对象或applet(参看IMAG、OBJECT、APPLET和INPUT
    元素)。
  • 建立图像映射(参看MAP和AREA元素)。
  • 提交一个表单(参看FORM)。
  • 建立一个框架文档(参看FRAME和IFRAME元素)。
  • 引用一个外部参考(参看Q、BLOCKQUOTE, INSDEL元素)。
  • 指向一个描述文档的metadata(参看HEAD元素)。

2.2 什么是HTML?

在全球范围内发布信息需要一个能被普遍理解的语言,一种所有计算机能理解
的母语。WWW使用的语言是HTML (超文本标记语言 - HyperText Markup
Language)。

HTML有以下用途:

  • 用标题、文本、表格、列表、照片等发布在线信息。
  • 通过超文本链接,在鼠标点击时取得在线信息。
  • 设计表单与远程服务通讯 - 查询信息、进行预订、订购产品等。
  • 把样式表、视频剪辑、音频剪辑和其它应用程序包含在文档中。

2.2.1

HTML历史简介

HTML最初由Tim Berners-Lee开发 - 当他在CERN时,因为NCSA开发的Mosaic浏
览器而流行起来。在1990年由于Web的爆炸性增长而得到成功。这期间,HTML以
多种不同方式被扩充。Web以来网页作者和零售商共享HTML的相同惯例。这就促
进了他们合作制定HTML的规范。

Internet Engineering Task Force (IETF)的支持下,在1994年末通用的规
则被制定为HTML 2.0(1995年11月制定)。HTML+ (1993)和HTML 3.0 (1995)在内
容上做了进一步的丰富。尽管从来没有收到标准讨论的一致同意,但是这些草
稿导致很多新特征的采用。WWW协会的HTML工作组在1996年的努力的结果是HTML
3.2
(1997年1月)。

多数人认为HTML文档应该在不同浏览器和平台上都工作得很好。取得互操作性
降低了内容提供者的费用,因为只需开发文档的一个版本。如果不做这种努
力,就会有使Web发展成不兼容格式的私有世界,最终会削弱Web对所有参加
者的商业潜力。

HTML的每个版本都试图反映更大的民意,以便内容提供者不会白花钱和他们的
内容不会在短时期内让人们无法阅读。

HTML已经发展成各种方式的设备都可以利用网上的信息:使用不同分辨率和色
彩深度的PC,蜂窝电话,手持设备,快速输入输出设备,使用高带宽和低带宽
的计算机,等等。

 

2.3 HTML 4.0

HTML 4.0通过以下机制扩展了HTML:样式表、脚本、框架、嵌入对象、改进的
从右到左的支持和混合方向文本、功能更强的表格、增强的表单,并且为残疾
人提供了访问的可能。

2.3.1 国际化

这个版本的HTML在设计过程中得到了国际化领域专家的帮助,因此可以用各种
语言写文档并易于在世界范围内发布。

设计过程中的一个重要步骤是采用了ISO/IEC:10646标准作为HTML的字符集。它
是处理国际化字符、文本方向、发音和其它语言问题的最具包容性的标准。

HTML现在在文档内提供对不同人类语言的更强大的支持。这就为搜索引擎提供
了更有效的文档索引功能、更高质量的排版格式、更好的文本到发音的转换、
更好的连字符连接,等等。

2.3.2 可访问性

既然网络社区在增长,而且它的成员的能力和技术各不相同,那么底层技术满
足他们的特殊需要是很重要的。HTML已经被设计成可以被有身体缺陷的人访问
的网页。HTML 4.0涉及到的便于访问的方面包括:

  • 文档的结构和表现更好地区分开来,这就鼓励使用样式表而不用HTML表现
    元素和属性。
  • 更好的表单,包括附加的存取键、按语意分类表单控件、SELECT选项和活
    动标签。
  • 标记作为内嵌对象的文本描述的能力(使用OBJECT元素)。
  • 一个新的客户端图像映射机制(MAP),允许把图像和文本链接集成在
    一起。
  • 替代文字与图像(包含在IMG元素内)和图像映射(包含在AREA元素内)
    一起出现。
  • 支持所有元素的titlelang属性。
  • 支持ABBRACRONYM元素。
  • 与样式表一起使用的更多的目标媒体(tty, braille, 等)。
  • 更好的表格,包括标题、列组、和实现不可见渲染的机制。
  • 表格、图像、框架等的长名描述。

在设计中考虑到可访问性因素不仅可以使设计者得到访问者的祝福,还有其它
的益处:设计良好的、把结构和表现分开的HTML文档会更容易地采用新技术。

2.3.3 表格

通过表格,设计者可以更好地控制结构和布局。定义列宽度的能力可以逐渐地
显示表格,而不必等到全部表格被绘制完。

2.3.4 混合文档

HTML现在提供在HTML文档中嵌入常见媒体对象和应用程序的标准机制。OBJECT
元素(与IMGAPPLET一起)提供了在文档内包含图像、视频、声音、数学、特殊
应用程序和其它对象的功能。

2.3.5 样式表

样式表简化了HTML标记并且减轻了HTML对表现形式的责任。它们使设计者和用
户都可以控制文档的表现形式 - 字体信息、对齐方式、颜色等。

样式信息可以为单独的元素或一组元素定制。样式信息可以定制在HTML文档内
或以外部样式表的形式出现。

把样式表与文档联系起来的机制独立于样式表语言。

在样式表出现之前,制作者很少能控制页面绘制过程。HTML 3.2包括一些属性
和元素,它们提供了对对齐方式、字体大小和文本颜色的控制。制作者也使用
表格和图像进行页面布局。用户需要较长时间才能升级他们的浏览器,意味着
对这些特征的使用还要持续一段时间。然而,既然样式表提供更强大的表现
机制,WWW协会将最终逐渐淘汰很多HTML的表现元素和属性。

2.3.6 脚本

通过脚本,制作者可以制作动态网页(例如,反应用户填充内容的"smart forms")
和使用HTML建立网络应用程序。

把脚本包含在HTML文档中的机制独立于脚本语言。

2.3.7 打印

有时,制作者希望读者不限于只打印当前文档。当文档成为一个工程的一部
分时,它们之间的关系可以被描述为使用HTML LINK元素或使用W3C的资源描述
语言(Resource Description Language - RDF)

2.4 用HTML 4.0制作文档

我们建议使用HTML 4.0的制作者和实现者遵循以下一般性规则

2.4.1 把结构和表现相分离

HTML起源于SGML - 一直是一种结构化标记规范的语言。当HTML逐渐成熟时,越
来越多的表现元素和属性正在被其它机制代替,尤其是样式表。经验表明把文
档的结构和它的表现相分离减少了适应不同平台、媒体和版本的代价。

2.4.2 考虑对Web的普遍访问性

为了每个人都可以访问Web,特别是那些有生理缺陷的,制作者应该考虑他们的
文档在不同的平台上是如何被渲染的:基于速度的浏览器、盲文阅读器等。
HTML提供了很多可以实现这些目的的机制,如alt属性、accesskey属性等。

还有,制作者应该记住读他们文档的计算机可能有多种不同的配置。为了让文
档能被正确地翻译,制作者应该在他们的文档中包含以下信息:自然语言的
名称、文本方向、文档如何编码,还有其它涉及国际化的信息。

2.4.3 帮助用户得到绘制更快的表格

通过在HTML 4.0中认真设计表格和使用表格的新特征,制作者可以使文档绘制
得更快。制作者可以学习如何制作绘制更快的表格。(参看TABLE元素)。

HTML 4.0规范
[第1章][第2章][第3章][第4章]

返回[FrontPage Image Map Component]