DeepIE: Deep Learning for Information Extraction
Go to file
2020-02-01 18:37:15 +08:00
config 基本框架构建 2020-01-07 18:31:44 +08:00
data 基本框架构建 2020-01-07 18:27:52 +08:00
docs add docs 2020-02-01 18:37:15 +08:00
models 基本框架构建 2020-01-07 18:31:44 +08:00
run 增加TODO计划 2020-01-07 23:02:29 +08:00
README.md add docs 2020-02-01 18:37:15 +08:00

DeepIE: Information Extraction Toolkit based Deep Learning

DeepIE : 基于深度学习的信息抽取工具包

主要内容包括:

  • 实体抽取/事件段落抽取/事件主体抽取
  • 实体链接
  • 实体-关系抽取
  • 事件抽取

涉及的数据领域包含:

  • 医疗
  • 金融
  • 电商
  • 法律

Installation

$ git clone https://github.com/loujie0822/DeepIE
$ cd DeepIE

Content 主要目录

主要算法介绍

  • 实体抽取/事件段落抽取/事件主体抽取
    •  
  • 实体链接

  • 关系抽取

  • 实体-关系抽取

  • 事件抽取

  • 评论观点抽取

Performance

任务类别 任务数据 核心策略 dev test
实体抽取

TODO任务排期

日期 任务 完成情况
1月7日-10日 基本框架设计
1月9日 实体/事件抽取技术总结1
1月10日 实体/实体-关系抽取codes开发
1月10日

开发要点

  • 深度学习模型的可复用部分要单独摘出。
    • 特别地对于BERT等预训练语言模型不要复用
  • 对于同一类型任务的数据源要单独处理统一定义数据输入的scheme。
  • 数据集要特别检查是否可以开源。

Reference

  1. https://github.com/zjunlp/deepke