H5W3
当前位置:H5W3 > 其他技术问题 > 正文

【搜索技术】中文语句中的实体关系抽取,具体怎么做?

比如一句话“健肾平喘汤联合硫酸沙丁胺醇气雾剂吸入治疗慢性持续期哮喘临床研究”。我想抽取出健肾平喘汤与慢性哮喘这两个实体是有联系的,一直没有找到好的办法,看了上百篇文献,由于算法居多,对于具体的还是不太明白,在这里请问大神。目前我知道的步骤是:1.分词,这里与NER结合,以降低分词不当造成的影响,或者使用自定义词典。然后可以对分词后的结果进行词性标注。2.使用句法分析器,如斯坦福工具等其他工具。后续的步骤就不清楚了。看到文章中有这样的做法:1.将关系抽取转换为分类的问题,构建分类模型;2.构建二元组或者三元组。由于本人是nlp初学者,刚刚接触,很多都不是很懂,但是马上就要开题了,很急的时间,想尽快摸索出一套可行的方法,请教大家后面具体的可以怎么实现,如何进行关系抽取

回答

就你举的例子是医学方面的文本,这是特定领域的实体关系抽取,就说已经有很多研究的NER也比较困难,因为大部分研究都是针对人、地点、机构、时间日期、货币等几类。首先是实体识别,可以使用现有的词汇表,或者自己用二元模型、三元模型进行训练,最后在加上规则,比如前后都是实体,可以连起来作为一个实体,这样基本上能识别一些出来。不过由于句子都比较复杂,句法分析器估计都用不上了,不然还可以从句法上找一些规则来拼接实体。关系识别可以先做简单的,就是一个句子里面出现的,都有关系,然后再根据关键词,定义特殊关系。

本文地址:H5W3 » 【搜索技术】中文语句中的实体关系抽取,具体怎么做?

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址