Causality event extraction demo project including casual patterns and experiment on large scale corpus. 基于因果关系知识库的因果事件图谱实验项目,本项目罗列了因果显式表达的几种模式,基于这种模式和大规模语料,再经过融合等操作,可形成因果事件图谱。
Go to file
2018-09-13 22:14:50 +08:00
.idea 添加readme 2018-09-13 22:11:00 +08:00
image 添加readme 2018-09-13 22:11:00 +08:00
papers 添加ppt 2018-08-26 15:50:23 +08:00
PPTS 添加ppt 2018-08-26 15:50:23 +08:00
.gitignore 添加readme 2018-09-13 22:11:00 +08:00
causality_extract.py 创建因果事件抽取 2018-03-17 19:55:17 +08:00
README.md Update README.md 2018-09-13 22:14:50 +08:00

CausalityEventExtraction

templated based causality event extraction 基于因果关系模式的因果关系抽取项目

项目介绍

现实社会是个逻辑社会,大量的逻辑即逻辑经验存在于我们的脑海中,而这些逻辑经验是无法穷举出来的,靠大量人工的总结,显然不切实际。然而,幸好人类将这种逻辑用文字表达出来了,这为我们利用自然语言处理技术实现这种因果逻辑的抽取提供了可能性。不过,受限于自己的技术水平,目前还无法将深度学习这套高端的打发应用于因果事件抽取当中,而以构造和总结因果模板,结合中文语言特点,构建因果语言知识库的方式代替。 本项目是对因果事件抽取以及因果知识图谱构建的一种尝试。

技术路线

因果事件图谱技术流程上遵循以下流程:
image

主要包括以下几个步骤:
1、因果知识库的构建。因果知识库的构建包括因果连词库结果词库、因果模式库等。
2、文本预处理。这个包括对文本进行噪声移除非关键信息去除等。
3、因果事件抽取。这个包括基于因果模式库的因果对抽取。
4、事件表示。这是整个因果图谱构建的核心问题因为事件图谱本质上是联通的如何选择一种恰当短语、短句、句子主干等方式很重要。
5、事件融合。事件融合跟知识图谱中的实体对齐任务很像
6、事件存储。事件存储是最后步骤基于业务需求可以用相应的数据库进行存储比如图数据库等。

最终效果

经过以上几个流程之后,可以支持各类查询,比如已知原因找结果,已知结果找原因等,这都很有事情,总之,数据库有了,我们可以做的事情有很多,接下来就是我们脑洞的事情了。 接下来以以下几个事件在因果知识库中查询一把: 以上几个图展示了输入既定事件在数据库中相似的事件(一度),相似事件导致的结果(二度节点)。

范冰冰偷税漏税事件

image

美国攻打伊拉克事件

image

寿光发生洪水事件

image

总结

1基于规则这套很实用但问题不少规则维护比较多
2事件表示这块一定要好好想想啊
3事件融合这块利用各种相似度度量进行计算都有一定缺陷

question?

send mail to lhy_in_blcu@126.com