读《生成语法:标准理论到最简方案》(徐烈炯著)和《乔姆斯基的形式句法——历史进程与最新理论》(石定栩著)
Chomsky的生成语法是当代语言学的精华,我对他的理论一直抱有敬畏。敬畏得不敢进入他那精密而富有变幻的世界。暑假趁暇,咬牙狠心,终于读了两本介绍生成语法的专著。也是,一个号称酷爱语言学并已奔六的家伙,现在还不弄明白Chomsky,难道真要等到垂垂老矣之时再做理会吗?
一.
生成语法的创始人、代表者和主帅是Chomsky。Chomsky有犹太人血统,其父是来自乌克兰的希伯来语学者。Chomsky的学士、硕士、博士学位均在美国宾夕法尼亚大学获得。他曾师从结构主义语言学家Zellig Harris,他1951年的硕士论文《现代希伯莱语语素音位学》(Morphopnonemics of ModernHebrew)就是以结构主义方法进行研究的。1955年,27岁的他完成博士论文《转换分析》,获得博士学位。他在博士论文基础上,写成了著名的《句法结构》一书于1957年出版。Chomsky后来一直在麻省理工学院的现代语言学系任教,麻省理工学院成了生成语法的大本营。
《句法结构》的出版打破了结构主义在语言学的统治,标志着生成语法的问世。Chomsky的生成语法被认为是20世纪现代语言学研究上最伟大的贡献,在语言研究领域引发了堪称“乔姆斯基革命”的突破。
Chomsky对语言的看法大致可以归纳为以下几点:
一.语言反映了心理。Chomsky一再强调他研究的语言学是心理学,最终是研究大脑的生物学,语言过程实为某种“心智表现”或“心智运算”。心智(mind)宛如计算机内的程序。他进而提出语言学应纳入生物语言学(Biolinguistics)即语言的生物学(biology of linguistics)。Chomsky 等多数生成语言学家认为语言学是经验科学,他们有的甚至认为语言学属于自然科学,而不是通常认为的属于社会科学。他们的语言学理论以20世纪中期西方哲学和自然科学认识论和方法论为基础。生成语法的研究程序体现了一般自然科学方法论著作中指出的科学研究共性。研究的全过程为9个主要步骤:定向、选题、发现、描写、解释、推广、论证、批评、反应。
二.语言能力中包含天赋成分。Chomsky强调区分“内在性语言”(internalized language, 简称I-language)和外在性语言(externalized language, 简称E-language),并明确表示研究的是前者。内在性语言指个人头脑中掌握的语言知识、或语言能力,人一出生就带有内在性语言的初始状态,随着接触母语,语言能力如同身体发育那样获得成长。每种语言都是句子的无限集合。每种语言都包含无穷多的句子。生成语法认为:人在有限的生命中不可能听到或看到无限多的句子,但人们可以听懂和说出该语言的无数句子,说明学习语言不是一句句学会的。考察儿童学习语言的情况,儿童在有限的时间里从有限的话语(通常是不标准的)中掌握了语言完整的语法知识。他们不但能够理解和造出他们已经听到过的句子,而且能够造出以前从未听过的句子。不管儿童学习语言的环境有多大的差异,他们还是能够达到大致相同的语言水平。乔姆斯基认为语言是某种天赋,儿童天生就具有一种学习语言的能力,就是将“有限的词汇和语法规则”转换成“无限句子”的能力。Chomsky认为语言机能(faculty of language)可看作是人脑的一个特殊器官, 它是人类特有的。每个人的语言机能基本相同,只是由于后天情况不同而略有差异。比如,小张会说汉语,约翰会说英语,是因为他俩头脑里都有内在性语言;小张说汉语的词语,约翰说英语的词语,说明他俩的内在性语言有所不同,但他俩头脑里的运算系统(即语法)基本上是一样的。
Chomsky指出:语法存在于人脑中,而说写出的句子则以语法为基础。所以语法是基本的,是第一性的,语言倒是派生的,是第二性的。
三.存在普遍语法。Chomsky提出了“普遍语法”的观点,用普遍语法来解释语感。普遍语法是人脑中的机制,普遍语法原则排除不合格的语法,是语法的语法。有了这个与生俱来的普遍语法,只要加入某种具体语言个性特点的参数,儿童就能在短短的两三年学会复杂的母语。因为每种语言的语法都体现普遍语法,儿童学语言就像根据参数调妥旋钮一样。
Chomsky认为:每个人的头脑里掌握了I语言,必要时就有能力创造E语言中的任何句子I语言是E语言的基础,语言学研究的重点应当是I语言,也就是语法。
所以,生成语法(generativegrammar)认为:I语言,人脑中的机械装置,能够识别和生成句子——生成而且只能生成合格的句子。而语法学家的任务就是:把人脑中内在的语感,或者说内在的语法知识,通过某种方式表达出来,拟构出生成语法。因此,生成语法不像结构语言学那样,注重语言实地调查、然后归纳、分类、发现、描写,生成语法不仅采用专用符号来进行形式化描写,而且用演绎法建立规则;提出理论假设,揭示现象背后的那些观察不到的过程和机制。
生成语法认为:人脑中的内在语法知识:句法部分、音系部分、语义部分。三部分组合成完整的语法系统。人们潜意识地掌握了各套规则,就能够鉴别句子在句法、音系和语义方面是否合格,就能够造出在句法、音系和语义方面都合格的句子来。
生成语法学中的“生成”(generate)既有“产生”、“创造”含义,也有“明确” 的意思,而“生成语法”则指表达明确的、形式化的语法。
有人归纳得好,在此借用一下。《句法结构》的出版,开始了语言学的如下转变:
1、研究对象由语言转为语法;
2、研究范围从语言转为语言能力;
3、研究目标从观察分类描写转为解释;
4、研究方向从处理语言素材转为评比语法假设。
二.
生成语法用语类语法(categorygrammar)来描写以便揭示如何用有限的语法规则生成无限的句子,体现说话者有关结构的语感。
生成语法要描写该语言中的全部句子。有没有这个可能?有。因为句子有递归性(recursiveness)。任意一个句子,总有办法在其中加上些成分使之变成一个新句子。句子总是由一些可分割的单位组成除线性关系外,更有结构层次关系。概括起来,无限的句子可以归结为数量很有限的语类。语类即句法结构成分:各种词类、不同类型的词组。生成语法用语类语法描写以达到用有限语法规则生成无限的句子。如:
S→NP VP
S表示句子,→ 表示改写(rewrite),NP表示名词词组,VP表示动词词组。以上表达式意为“句子可改写为(或定义为)名词词组加上动词词组。”
语类规则的特点之一是形式化。用一系列符号代替语类、关系和特征。下面是各种语类规则的表达式:
S→NPVP
NP→D (A) N (D代表限定词,A代表形容词,括号代表可以有可无,N表名词)
VP→V NP
VP→V PP(PP代表介词短语)
VP→V S'(S'代表从句)
PP→P NP(P代表介词)
S→NP I VP(I代表助动词或动词的形态变化)
S'→ CS(S'代表超句,C代表标句词,如that)
语类规则的特点之二是演绎法。例如从表达式S→NP VP作如下推导:
S→NPVP(意为:句子由名词词组和动词词组构成)
NP→D (A ) N (意为: 名词词组由限定词,或许还有形容词,和名词构成)
VP→V NP(意为: 动词词组由动词和名词词组构成)
这是所谓的词汇前结构(pre-lexicalstructure)。Chomsky设想有一抽象的词典,他称之为词库lexicon, 词库由词项lexicalitem构成,每个词项包括词的语音、句法和语义特征。从词库里选取相应的词来插入以上符号就得到词汇后结构(post-lexical structure)比如说:
the boy hit theball用树形图表示如下:
有了一条条语类规则就能够画出一棵棵这样倒长的树。在树上的每一个分叉处被称为节点(node)树形图直观易懂,便于给句法关系下定义。从上面的树形图看,S(句子)是最大的节点,它直接统辖着NP和VP这两个节点,并且统辖其他所有节点。借用亲属关系来描述,S是母亲节点,NP和VP是S的女儿节点,NP和VP是姐妹节点,以此类推,NP和VP也有自己的女儿节点,它们各自统辖下的平行节点也是姐妹节点。每两个节点之间存在着上下或先后的关系:位于上层的节点居高,位于左边的节点领先。
重要的是,生成语法把句法看作动态过程。一个句子的产生是一个包含好几个阶段的句法过程,过程中最关键的部分是转换。转换规则有:移位规则(如疑问词移位规则)、删略规则(如命令句删略规则和同语删略规则)、插入规则、改变特征规则、复制规则、被动化规则等。通过转换,可以由同一个基础结构得到表面上不同的句子形式。
通过语类规则和转换,可以生成无数无限的句子来。但是,一个理想的装置应当能够生成一切合格的句子而且只能生成合格的句子。生成语法强调要把一切交代得清晰无误,发出的指令机器也能够执行。(事实上,Chomsky的生成语法对计算机技术有重大的贡献!)
车轮滚滚,一日千里,但也须有良好的刹车才行。
所以必须对转换进行一定的限制。生成语法的限制规则有:
A盖A原则、禁区条件、复合名词词组限制、并列结构限制、左分支条件、主语从句限制、疑问词禁区限制、领属条件、时态句条件、明确的主语条件、规则顺序限制、严格层级原则、结构原状原则……
对生成语法的其他部分也有限制,如删略要遵循还原原则,表层结构则由多重充盈COMP鉴别式、空主语鉴别式和For-To鉴别式等来限制,解读时由统制条件、主格禁区条件、封闭条件等限制……
除了规则系统外,Chomsky的生成语法还有原则系统。生成语法有概括的原则如完全解读原则(Principal of FullInterpretation)和允准原则(Principal of Licensing),有具体的原则,如X′理论中的X′原则、θ理论中的θ准则、格理论中的赋格原则、管辖理论中的空语类原则、约束理论中的约束原则、控制理论中的最短距离原则,界限理论中的领属条件,等等。
生成语法初衷是以简繁驭,但面对剪不断理还乱的语言现象,也难免陷于纷乱晦涩。历尽沧桑的Chomsky最后拿起奥卡姆剃刀(Occam’s razor)对以往的规则、运算进行了大刀阔斧的简化。例如,将生成语法的运算简化为选取Select和合并Merge。当然,生成语法的神来之笔——移位(Move)也是必不可少的。在Chomsky看来,移位其实就是复制加合并(Copy and Merge), 最简方案提供了一个能概括一切移位的说法:移位都是为了核对特征(feature checking)。印欧诸语言中动词和名词在人称、性、数等方面必须保持一致,这就体现了特征的核对。词项的有些特征在词库里已经取值,有的要在进入句法运算系统以后才能取值,取值后进入PF(语音)层面后就可以定型,即可以读写出来。
三.
生成语法诞生以来,已历时五十余载,与不才的年龄偶合。Chomsky大名于我,如雷贯耳。除了对他学术上的造诣仰之弥高外,我对他还有另外两点感触。其一,Chomsky好发政见,是西方知识分子中著名的左派。有的意见很好,比如反对越南战争;有的观点幼稚,比如否定高棉屠杀。总之,书生之见,有时未必周全。但Dr Chomsky乐此不疲,颇为自得。其二,Chomsky自己曾叛出师门,也敢于否定自己。几十年里,生成语法阵营内部多次发生危机,他的不少弟子也扯旗造反,就像当初Chomsky本人那样。每次遇到危机,Chomsky自己收拾局面,针对问题大幅度修改已有的架构,用新的理论和方法取而代之,逐步完善。这种大将风度令在下唏嘘不已!
Chomsky的生成语法可以划分为以下几个阶段:
(一) 1957年—1965年为古典理论阶段。在这阶段,Chomsky的代表作是《句法理论》
(二) 1965年—1970年为标准理论阶段。在这阶段,Chomsky的代表作是《句法理论的若干问题》。
(三) 1970年—1979年为扩展标准理论阶段。在这阶段,Chomsky的代表作是《关于动词名物化的一些看法》和《深层结构、表层结构及语义说明》。
(四) 1979年—1993年为支配和约束理论阶段。在这阶段,Chomsky的代表作是《支配和约束论集》和《支配及约束理论的一些概念和影响》
(五) 1993年至今为最简方案时期。在这阶段,Chomsky的代表作是《语言学理论最简方案》、《极纯短语结构》和《最简方案》。
原来的生成语法模型的流程大致是这样的:
经过不断扬弃,不断改进,不断简化,Chomsky在其最简方案中将语法模型流程图简化为:
最简方案的简化遵循的是经济原则,其精神可以通俗地说:能小做不大做,能少做不多做,能不做则不做,能迟做不早做。这不仅是科学方法,简直就是一种生活态度!正合吾意,我愿奉为圭臬。
研读Chomsky的生成语法,对其涉及词库的部分很感兴趣,可惜语焉不详,希望以后能找到资料看看。早年学语言学,说语言的三大部分是语音、语法和词汇。生成语法中除了理所当然有狭义的语法学(词法、句法)外,也涵盖了语音学,生成音系学即是其一旁支,还是有一支是赫赫有名的生成语义学,但就是没有词汇学的名头。
文以载道。语言载什么?意义吧。研究语言而剥离词汇,也就忽视了意义。结构语言学因不讨论意义被人诟病,成为其软肋。Chomsky早期的生成语法也不谈意义,他在《句法结构》把Colorless green ideas sleepfuriously(无色的碧绿想法在狂躁地安睡)这样的胡说八道列为合格的句子。后来爆发了同门大战 ,对方扯起生成语义学大旗,差点要了生成语法的老命。后来Chomsky对生成语法进行了改动,增加了语义部分,在基础部分还专门列了词库,并且一直保留至今。最简方案的运算过程的第一步选取就是从词库里挑出一组词汇和功能性成分来,形成一个词汇系列。词库中每个词项带有该词项的语音、句法和语义特征。最简方案的词库以词的具体表现形式为单位,例如take、takes、took、taken、taking作为不同的词项分别列入词库。以我之见,目前的词库只是一个类似魔术师的魔匣,生成语法的一些棘手的难题好像都可以扔进去,然后变个乖巧的女孩子出来。看来词库的存在,某种程度上是为了给运算提供便利,拾遗补漏,并没有进入词汇领域的核心。
词汇部分庞大、离散,可能处理起来很难,也感到无序。但按照生成语法的理念,应该有一个内在的、简约的结构和规则制辖着词库。我想,生成语法今后的任务和发展,好像要在词汇上进行突破才是。否则总是一个缺憾。