本项目构建了完整的基于豆瓣电影、书籍的知识图谱问答系统,包括从豆瓣原始数据的爬取、豆瓣原始数据转换得到RDF数据、三元组数据的存储与检索、问句理解和答案推理、微信公众号部署等环节,在此分享给大家,共同学习。为帮助理解,可参考以下文章进行实现知识图谱问答系统,文章已更新完成。
- 电影知识图谱问答(一)|爬取豆瓣电影与书籍详细信息
- 电影知识图谱问答(二)|生成298万条RDF三元组数据
- 电影知识图谱问答(三)|Apache Jena知识存储及SPARQL知识检索
- 电影知识图谱问答(四)| 问句理解及答案推理
- 电影知识图谱问答(五)| BM-KGQA Demo
要求: Ubuntu or MacOS, python3.6, [jieba, refo, SPARQLWrapper, web]依赖包
因数据文件过大,所以将文件放到百度云,链接: https://pan.baidu.com/s/1bKIrrzoezuAQf-EK5ISG_Q 提取码: prcq。下载完成后放入到data/文件夹内即可。
修改DouBan-KGQA/json2jena/rdf2jena/apache-jena-fuseki-3.10.0.2/run/configuration/fuseki_conf.ttl中ja:rulesFrom和tdb:location路径地址。
进入到DouBan-KGQA/json2jena/rdf2jena/apache-jena-fuseki-3.10.0.2/路径下,启动fuseki-server。
cd DouBan-KGQA/json2jena/rdf2jena/apache-jena-fuseki-3.10.0.2/
./fuseki-server
启动query_main.py进行知识图谱问答。
python query_main.py