微生物领域数据集整合了病毒、宿主、基因、蛋白质、文献、专利等多种生物医学信息,构建了一个多层次、多关系的知识网络。该数据集包含665万个实体,1114万条关系,其中涵盖了病毒分类、核苷酸和蛋白质信息、宿主关联、地理分布、文献支持等多个维度。通过该数据集,研究人员可以进行病毒变异追踪、病原体传播分析、基因-蛋白互作研究,以及疫苗和药物开发等应用。可以更加高效的生物数据组织和查询方式,促进微生物学、病毒学及公共卫生领域的研究,加速疾病防控与治疗方案的制定。
本次性能测评共选取 74 条 Cypher 查询语句,并分别在 PandaDB 科学数据融合管理系统与 Neo4j 中运行对比测试。测试结果如下,其中依据查询在 Neo4j 中的执行时间是否超过 100ms,将测试语句划分为两类。
Neoej耗时在100ms以上:
Neoej耗时在100ms以内:
测试结论:
1、100ms以上,PandaDB有明显优势,能达到1.5-10倍的加速,2s的查询可以先限制到0.2s。
2、100ms以下,没有加缓存的情况下,性能与neo4j持平