超文本标记语言(英文:HyperText Markup Language,HTML)。是为“网页创建及其它可在网页浏览器中看到的信息”设计的一种标记语言。HTML被用来结构化信息,例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义。由蒂姆・伯纳斯.李给出原始定义,由IETF用简化的SGML语法进行进一步发展的HTML,后来成为国际标准,由万维网联盟维护。页面内包含图片,链接,音乐,结构包括头和主题两部分,头提供网页信息,主体提供网页具体内容。超文本标记语言是万维编程的基础,是文本包含超级链接点的一种形式。
标记语言_超文本标记语言 -超文本标记语言概述
超文本标记语言
在WWW上的一个超媒体文档称之为一个页面(page)。作为一个组织或个人在万维网上开始点的页面称为主页Homepage,或首页,主页中通常包括有指向其他相关页面或其他节点的指针(超级链接)。在逻辑上将视为一个整体的一系列页面的有机集合称为网站(Website或Site)。
Web页面也就是通常所说的网页,在本书中不作区分。
HTML是一种规范,一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理,画面如何安排,图片如何显示等)。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。
HTML之所以称为超文本标记语言,是因为文本中包含了所谓“超级链接”点。所谓超级链接,就是一种URL指针,通过激活(点击)它,可使浏览器方便地获取新的网页。这也是HTML获得广泛应用的最重要的原因之一。
由此可见,网页的本质就是HTML,通过结合使用其他的Web技术(如:脚本语言、CGI、组件等),可以创造出功能强大的网页。因而,HTML是Web编程的基础,也就是说万维网是建立在超文本基础之上的。
标记语言_超文本标记语言 -HTML文件的整体结构
超文本标记语言一个网页对应于一个HTML文件,HTML文件以.htm或.html为扩展名。可以使用任何能够生成TXT类型源文件的文本编辑来产生HTML文件。
标准的HTML文件都具有一个基本的整体结构,即HTML文件的开头与结尾标志和HTML的头部与实体2大部分。有3个双标记符用于页面整体结构的确认。
1)和双标记符
标记符说明该文件是用HTML来描述的。它是文件的开头,而则表示该文件的结尾,它们是HTML文件的始标记和尾标记。
2)和头部标记符
这2个标记符分别表示头部信息的开始和结尾。头部中包含的标记是页面的标题、序言、说明等内容,它本身不作为内容来显示,但影响网页显示的效果。头部中最常用的标记符是标题标记符和,它用于定义网页的标题,它的内容显示在网页窗口的标题栏中,网页标题可被浏览器用作书签和收藏清单。
3)和正文标记符
网页中显示的实际内容均包含在这2个正文标记符之间。正文标记符又称为实体标记。
一个不包含任何内容的基本网页文件如下所示:
标记语言_超文本标记语言 -文档标题
页面主体内容描述
标记网页的开始
标记头部的开始
超文本标记语言
头部元素描述,如文档标题等
标记头部的结束
标记页面正文开始
页面实体部分
标记正文结束
标记该网页的结束
当然,如果不使用以上基本框架结构,而直接使用在实体部分中出现的标记符,在浏览器下也可以解释执行。
三、正文标记的使用
每种HTML标记符在使用中可带有不同的属性项,用于描述该标记符说明的内容显示不同的效果。正文标记符中提供以下属性来改变文本的颜色及页面背景。
BGCOLOR 用于定义网页的背景色
BACKGROUND 用于定义网页背景图案的图像文件
TEXT 用于定义正文字符的颜色,默认为黑色
LINK 用于定义网页中超级链接字符的颜色,默认为蓝色
VLINK 用于定义网页中已被访问过的超接链接字符的颜色,默认为紫红色
ALINK 用于定义被鼠标选中,但未使用时超链字符的颜色,默认为红色
例如:标记将定义页面的背景色为黑色,正文字体显示为白色。
以上属性使用中,需要对颜色进行说明,在HTML中对颜色可使用2种方法说明颜色属性值,即颜色名称(英文名)和颜色值。其中颜色值用6个十六进制数来分别描述红、绿 、蓝三原色的配方法――称为RGB值,每2个十六进制数表示一种颜色。使用颜色值时,应在值前冠以“#”号。
使用图案代替背景颜色,可以使页面更生动、美观。例如:
。
可将图像文件image.gif所表示的一幅图像作为页面的背景,若图像幅面不够大,将会将图像重复平铺在窗口中。
四、HTML字符集
在网页中除了可显示常见的ASCII字符和汉字外,HTML还有许多特殊字符,它们一起构成了HTML字符集。有2种情况需要使用特殊字符,一是网页中有其特殊意义的字符,如:;二是键盘上没有的字符。
HTML字符可以用一些代码来表示,代码可以有2种表示方式。即字符代码(命名实体)和数字代码(编号实体)。字符代码以&符开始,以分号结束,其间是字符名;数字代码也以&符开始,以分号结束,其间是#号加编号。
五、HTML的有关约定
在编辑HTML文件和使用有关标记符时有一些约定或默认的要求。
(1) 文本标记语言源程序的文件扩展名默认使用htm或html。在使用文本编辑器时,注意修改扩展名。而常用的图像文件的扩展名为gif和jpg。
(2) HTML源程序为文本文件,其列宽可不受限制,即多个标记可写成一行,甚至整个文件可写成一行;若写成多行,浏览器一般忽略文件中的回车符(标记指定除外);对文件中的空格通常也不按源程序中的效果显示。完整的空格可使用特殊符号“ (注意此字母必须小写,方可空格)”表示非换行空格;表示文件路径时使用符号“/”分隔,文件名及路径描述可用双引号也可不用引号括起。
(3) 标记符中的标记元素用尖括号括起来,如:、,带斜杠的元素表示该标记说明结束;大多数标记符必须成对使用,以表示作用的起始和结束;标记元素忽略大小写,即与作用相同,但完整的空格可使用特殊符号“ (注意此字母必须小写,方可空格)”;许多标记元素具有属性说明,可用参数对元素作进一步的限定,多个参数或属性项说明次序不限,其间用空格分隔即可;一个标记元素的内容可以写成多行。
(4) 标记符号,包括尖括号、标记元素、属性项等必须使用半角的西文字符,而不能使用全角字符。
(5) HTML注释由惊叹号表示,注释内容由符结束。注释内容可插入文本中任何位置。任何标记若在其最前插入惊叹号,即被标识为注释,不予显示。