作者:mobiledu2502885523 | 来源:互联网 | 2023-09-04 19:07
该楼层疑似违规已被系统折叠隐藏此楼查看此楼序言陆俭明在学术研究领域,袁毓林可以说是一位勤奋的耕耘者。他的论文集《汉语语法研究的认知视野)(商务印书馆)于2004年出版
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼
序言
陆俭明
在学术研究领域,袁毓林可以说是一位勤奋的耕耘者。他的论文集《汉语语法研究的认知视野)(商务印书馆)于2004年出版,现在又推出了新的论文集《基于认知的汉语计算语言学研究》。我大略地翻阅了一下全书各篇的内容,论文集的书名“基于认知的汉语计算语言学研究”,点明了该书的基本内容——从认知的视角来研究计算语言学,特别是中文信息处理的问题。正文具体分四部分内容:
第一部分内容,作者取名为“计算理论和语言研究”,包括四篇文章:《计算语言学的理论方法和研究取向》、《基于统计的语言处理模型的有用性和局限性》、《认知科学和汉语计算语言学》和《面向当代科技的语言研究的理论和方法》。计算语言学的研究,大致可以分为两个层面,一个是理论模型的研究,一个是工程研究(或说具体的技术方法研究)。据我所知,袁毓林主要从事理论模型的研究,所以这一部分内容作者主要从宏观的角度介绍说明了计算语言学的理论方法和研究取向;评述了在自然语言处理中已运用过的基于规则和基于统计的两种处理模型,指出处理语言这种复杂的系统“必须走规则和统计相结合的道路”;从认知科学的视角作者把自己认为有价值的并且是可行的计算语言学研究模式介绍给读者,并结合作者自己的研究实践讨论说明了基于认知并面向计算的汉语语法研究的路线;展示了认知语言学和计算语言学相互结合的可能性。这部分内容对有兴趣了解或从事计算语言学研究的人来说,是值得一读的,是很有启迪意义的。
第二部分内容,作者取名为“论元结构和描述框架”,也包括四篇文章:《论元角色的层级关系和语义特征》、《一套汉语动词的论元角色的语法指标》、《汉语谓词的论元结构的描述框架》和《论元结构和句式结构互动的动因、机制和条件——表达精细化对动词配价和句式构造的影响》。袁毓林是我国最早研究配价问题的学者之一,特别是他第一个发表了有关汉语名词配价的研究成果,该成果被广为引用。
以乔姆斯基为代表的生成语法学派所提出的动词论元结构理论与法国依存语法学派特斯尼耶尔提出的动词配价结构理论有相同的一面,当然出发点不同,思考的角度不同,对语言事实解释的广度与深度也不同。十多年来袁毓林一直致力于动词论元结构的研究,在这
方面他发表了一系列有分量的文章。我所主持的两个重大科研项目“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”(国务院973国家重点基础研究发展规划项目“图像、语音、自然语言理解与知识挖掘”子课题)和“汉语语义知识的形式化模型及语义分类系统研究”(教育部重点研究基地项目),袁毓林都参加了,其中的“汉语动词的题元系统及其语法指标”(包括“题元的层级体系”,“各别题元的定义、示例和句法语义特点”,“不同题元之间的配合关系”,以及“各别题元的语法指标”)就是由袁毓林执笔起草的。因此本书这一部分内容可以说是他对自己在配价问题和动词论元结构研究方面成果的汇集。在这部分内容中,他不仅建立并提出了汉语动词论元角色的层级体系,定义了各个语义角色,并细致描述了各个语义角色在述谓结构中所表现出来的动态性语义特征,同时通过十个各具特色、有代表性的实例(谓词“切、包1、包2、调查、帮忙1、帮忙2、飞1、飞2、吃、专政”)给出了谓词及其论元的句法配置方式,提出了汉语谓词论元结构的描写框架。更值得注意的是,他探讨了谓词论元结构和句式结构(constructions) 互动的动因、机制和条件,对汉语谓词所谓“变价”和“论元增容”作了进一步的解释。
第三部分内容,作者取名为“信息抽取和语义标注”,包括五篇文章:《信息抽取的语义知识资源研究》、《用动词的论元结构跟事件模板相匹配一-一种由动词驱动的信息抽取方法》、《用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用》、《基于论元结构的语义标注的体系和规范》以及《新闻语体真实文本的语义标注的实践》。这部分内容作者主要提出并举例说明了要使计算机有效地自动从真实文本抽取信息,至少要有三种层面的语义知识:话语篇章知识、谓词论元结构知识和句子的逻辑结构知识;为对真实文本进行语义分析和标注,作者细致分析设计了篇章、谓词论元结构、句子逻辑结构这三种层面各自的语义关系,并为这三种层面各自的语义关系设计
并提出了一套可扩充的标记集;作者还以自己设计的这套标记对新闻报道中关于职务调动的真实文本进行了语义关系标注实践。作者标注得相当认真。通过这样的标注实践又有所发现——真实文本中代词或指示词的先行成分(一般称为先行语)常常是隐含的;段落之间的
衔接,其形式手段相当缺乏。这就促使大家去进一步思考、探索怎么为计算机自动处理真实文本解决这方面的难题。
第四部分内容,作者取名为“专题研究和个案分析”,也包括五篇文章:《容器隐喻和套件隐喻及相关的语法现象——词语同现限制的认知解释和计算分析》、《关于分词规范和规范词表的若干意见》、《中文信息处理中的语言难题问答》、《缓冲式移动通信及其发展方向——
一个语言学家的设计思想》和《走向多层面互动的汉语研究》。这部分值得细细阅读的是《容器隐喻和套件隐喻及相关的语法现象――词语同现限制的认知解释和计算分析》和《走向多层面互动的汉语研究》这两篇文章。前一篇文章主要通过对“满”、“全”,特别是“满+NP”、“全+NP”在意义、用法上的不平行性的解释,说明语言中的许多现象只有从认知的隐喻的视角来加以解释——用容器隐喻来解释“满”背后的概念结构以及由“满”构成的“满+NP”的使用特点,用套件隐喻来解释“全”背后的概念结构以及由“全”构成的“全+NP”的使用特点,这样才能说得清楚,说得圓满,说得充分,才能有解释力;通过对“满”和“全”又具有一定的可替换性的解释,说明隐喻分析有必要提升到更为抽象的意象图式水平,这样才更有解释力,才能最终解释说明既然“满”、“全”背后的概念结构是属于不同的隐喻范畴,为什么有时又具有可替换性,即才能说明为什么容器隐喻和套件隐喻在语言的实际使用中会出现二者中和化的现象;更积极的意义,还在于正如作者在文章中所指出的,有助于语言的认知解释有可能实现形式化和可计算,从而有可能实现认知和计算的统一(“有可能”三个字不是作者说的,是我加的)。后一篇文章是作者为徐杰所编的《词汇语法语音的相互关联——第二届肯特岗国际汉语语言学圆桌会议(2002.11.26-30.)论文集》所写的代前言。文章扼要回顾了20世纪汉语研究的历史,对今后的汉语研究发表了很有见地的看法。作者强调指出,汉语研究必须树立“互动观念”,走多层面互动研究之路,而这方面正是目前汉语学界所缺乏的。文章特别谈到了一段时间来成为人们热门话题的所谓“语法研究三个平面”的问题,作者强调指出,“我们不仅应该分清语法的三个不同的平面,而且应该观察这三个不同的平面之间的互动关系”,并应“引入语言类型学的视野”,“引进语法化这种动态性的概念,来审视语法、语义和语用这三个平面之间的互动关系”,“从而打破共时研究和历时研究之间的藩篱,把语言的共时研究和历时研究沟通起来”,以“推动语言研究走向更为全面、综合和多层面互动的道路”。文章以学界已有的研究成果和作者本人的研究成果具体说明了语法和语音之间、词库结构和句法操作之间的互动关系,以及这种互动所应有的限度。这是很有见地的看法,应引起大家重视。
我虽然只粗粗阅读了一遍,觉得收获良多,推荐大家一读。借此机会我也想发表两点看法,同时也想提出一些意见。