感谢Datawhale无私知识分享!

Task02 包含以下内容:
使用实际医疗数据进行数据导入和识别 【主】

启动医疗知识库的查询服务【次】

具体的代码详解会在后续笔记中,task02 只做整体运行性的梳理,目的在于帮助拿到代码并已安装好Neo4j的同学顺利运行该项目。

医疗数据导入

医疗数据以及对应代码源自项目[1]

1. 将GitHub项目克隆至本地

2. 安装项目依赖

jieba:

pip3 install gensim

py2neo:

pip3 install py2neo

ahocorasick :
安装microsoft visual c++ build tools

pip3 install pyahocorasick

如果发现from sklearn.externals import joblib这句报错,原因为sklearn版本过高,可选解决方式:

  1. 选用低版本的sklearn :
     install scikit-learn==0.20.3
  2. 直接安装joblib包,并使用joblib将模型dump后替换原model文件夹下对应模型,这一方式是组内同学Xiesy提供的解决思路,非常感谢TA的知识分享!

3. 变量本地化

在build_graph.py文件中将数据库连接信息修改为自己的信息,在忘记密码的场合可以参考[2]来重置密码.

4. 导入数据

bash中运行即可,过程会花点实际,不报错的话耐心等待即可。

python build_graph.py

启动服务

bash中执行即可,

 python kbqa_test.py

Reference

[1] https://github.com/zhihao-chen/QASystemOnMedicalGraph
[2] https://blog.csdn.net/sinat_39595180/article/details/108379378