依存句法是由法国语言学家L.Tesniere最先提出。它将句子分析成一颗依存句法树,描述出各个词语之间的依存关系。
例如,句子:坚决惩治贪污贿赂等经济犯罪 的依存结构如下图:
现在国内外关于依存句法分析的研究主要分三个方面:
- 基于转移的依存句法分析
- 基于语法的依存句法分析
- 基于图的依存句法分析
这里主要记录一些博主对基于图的依存句法分析的学习
基于图的依存句法分析就是为每个要分析的句子生成一个有向图,其中:节点是句子中的单词,边是单词之间的依存关系,因为依存句法中规定每个句子都有其核心成分,所以加入了须根节点。依存句法中还规定了句子中除了须根节点,每个词必须依存于其他词,因此,句子依存图中边的个数和单词的个数相等。
例句:反对腐败是贯彻执行党的基本路线的必然要求
预测句子的依存对为:
依赖词 | 核心词 |
---|---|
**是 | root** |
反对 | 要求 |
腐败 | 要求 |
**贯彻 | 要求** |
执行 | 要求 |
党的基本路线 | 要求 |
的 | 要求 |
必然 | 反对 |
要求 | 党的基本路线 |
正确句子的依存对为:
依赖词 | 核心词 |
---|---|
是 | root |
反对 | 是 |
腐败 | 反对 |
贯彻 | 要求 |
执行 | 贯彻 |
党的基本路线 | 贯彻 |
的 | 贯彻 |
必然 | 要求 |
要求 | 是 |
预测依存对中加粗的是正确的依存对,容易发现,只有两个依存对是正确的,分析效果很不好,可能的原因是我训练特征权重时,没有用预测的依存图和正确的依存图共同作用于权重,使得特征权重有点过拟合。所以,下一步我打算实现解析算法,重新训练特征权重,以提高准确率。