diff --git a/README.md b/README.md index e306b19..1636530 100644 --- a/README.md +++ b/README.md @@ -7,15 +7,15 @@ templated based causality event extraction 本项目是对因果事件抽取以及因果知识图谱构建的一种尝试。 # 技术路线 -因果事件图谱技术流程上遵循以下流程: +因果事件图谱技术流程上遵循以下流程: ![image](https://github.com/liuhuanyong/CausalityEventGraph/blob/master/image/schema.png) 主要包括以下几个步骤: -1、因果知识库的构建。因果知识库的构建包括因果连词库,结果词库、因果模式库等。 -2、文本预处理。这个包括对文本进行噪声移除,非关键信息去除等。 -3、因果事件抽取。这个包括基于因果模式库的因果对抽取。 -4、事件表示。这是整个因果图谱构建的核心问题,因为事件图谱本质上是联通的,如何选择一种恰当(短语、短句、句子主干)等方式很重要。 -5、事件融合。事件融合跟知识图谱中的实体对齐任务很像 -6、事件存储。事件存储是最后步骤,基于业务需求,可以用相应的数据库进行存储,比如图数据库等。 +1、因果知识库的构建。因果知识库的构建包括因果连词库,结果词库、因果模式库等。 +2、文本预处理。这个包括对文本进行噪声移除,非关键信息去除等。 +3、因果事件抽取。这个包括基于因果模式库的因果对抽取。 +4、事件表示。这是整个因果图谱构建的核心问题,因为事件图谱本质上是联通的,如何选择一种恰当(短语、短句、句子主干)等方式很重要。 +5、事件融合。事件融合跟知识图谱中的实体对齐任务很像 +6、事件存储。事件存储是最后步骤,基于业务需求,可以用相应的数据库进行存储,比如图数据库等。 # 最终效果 经过以上几个流程之后,可以支持各类查询,比如已知原因找结果,已知结果找原因等,这都很有事情,总之,数据库有了,我们可以做的事情有很多,接下来就是我们脑洞的事情了。 @@ -31,9 +31,9 @@ templated based causality event extraction ![image](https://github.com/liuhuanyong/CausalityEventGraph/blob/master/image/shouguang.png) # 总结 -1)基于规则这套,很实用,但问题不少,规则维护比较多 -2)事件表示这块一定要好好想想啊 -3)事件融合这块,利用各种相似度度量进行计算,都有一定缺陷 +1)基于规则这套,很实用,但问题不少,规则维护比较多 +2)事件表示这块一定要好好想想啊 +3)事件融合这块,利用各种相似度度量进行计算,都有一定缺陷 # question? -send mail to lhy_in_blcu@126.com \ No newline at end of file +send mail to lhy_in_blcu@126.com