感谢Datawhale无私知识分享!
Task02 包含以下内容:
使用实际医疗数据进行数据导入和识别 【主】
启动医疗知识库的查询服务【次】
具体的代码详解会在后续笔记中,task02 只做整体运行性的梳理,目的在于帮助拿到代码并已安装好Neo4j的同学顺利运行该项目。
医疗数据导入
医疗数据以及对应代码源自项目[1]
1. 将GitHub项目克隆至本地
2. 安装项目依赖
jieba:
pip3 install gensim
py2neo:
pip3 install py2neo
ahocorasick :
安装microsoft visual c++ build tools
pip3 install pyahocorasick
如果发现from sklearn.externals import joblib这句报错,原因为sklearn版本过高,可选解决方式:
- 选用低版本的sklearn :
install scikit-learn==0.20.3
- 直接安装joblib包,并使用joblib将模型dump后替换原model文件夹下对应模型,这一方式是组内同学Xiesy提供的解决思路,非常感谢TA的知识分享!
3. 变量本地化
在build_graph.py文件中将数据库连接信息修改为自己的信息,在忘记密码的场合可以参考[2]来重置密码.
4. 导入数据
bash中运行即可,过程会花点实际,不报错的话耐心等待即可。
python build_graph.py
启动服务
bash中执行即可,
python kbqa_test.py
Reference
[1] https://github.com/zhihao-chen/QASystemOnMedicalGraph
[2] https://blog.csdn.net/sinat_39595180/article/details/108379378