Construction of Knowledge Graph of Wheat Varieties and Pest Control

ZHAOXiang, YANGWanxia, YANGJun, XINChen, LIQi

Journal of Agriculture ›› 2025, Vol. 15 ›› Issue (12) : 19-26.

PDF(1772 KB)
Home Journals Journal of Agriculture
Journal of Agriculture

Abbreviation (ISO4): Journal of Agriculture      Editor in chief: Shiyan QIAO

About  /  Aim & scope  /  Editorial board  /  Indexed  /  Contact  / 
PDF(1772 KB)
Journal of Agriculture ›› 2025, Vol. 15 ›› Issue (12) : 19-26. DOI: 10.11923/j.issn.2095-4050.cjas2024-0162

Construction of Knowledge Graph of Wheat Varieties and Pest Control

Author information +
History +

Abstract

The paper aims to address the issues of wheat variety selection and corresponding pest and disease control in different regions. Firstly, a data corpus with 3481 wheat variety data and 312 pest data was constructed. According to the characteristics of the corpus, the knowledge system model layer of wheat variety and pest control was defined in a fine grained manner. Secondly, the comparative advantages of Bert and Word2vec word - embedding models on small and medium-sized datasets were verified on public datasets and constructed datasets respectively, and then the attribute knowledge of wheat varieties and pests was extracted by using models suitable for each scale datasets. The experimental results showed that the F1 value of Bert-BiLSTM-CRF model was 0.1499 higher than that of Word2vec-BiLSTM-CRF model in breed datasets. Word2vec-BiLSTM-CRF model was superior to Bert-BiLSTM-CRF model in pest datasets.

Key words

knowledge extraction / knowledge graph / pattern layer / wheat pests and diseases / wheat corpus / Bert-BiLSTM-CRF model / word - embedding model

Cite this article

Download Citations
ZHAO Xiang , YANG Wanxia , YANG Jun , et al . Construction of Knowledge Graph of Wheat Varieties and Pest Control[J]. Journal of Agriculture. 2025, 15(12): 19-26 https://doi.org/10.11923/j.issn.2095-4050.cjas2024-0162

References

[1]
高锐涛, 林达伟, 郭亮, 等. 基于知识图谱的水稻种植智能问答系统设计与实现[J]. 计算机工程, 2024, 50(12):133-141.
随着农业信息技术的发展, 在互联网中积累了大量与水稻种植相关的数据。为解决农民在种植过程中难以快速获取准确答案的问题, 从水稻种植领域出发, 构建了基于知识图谱的智能问答系统。通过手工收集与爬虫技术获取相关数据, 通过构建命名实体识别模型和意图识别模型等自然语言处理技术并结合前后端技术, 最终实现了水稻种植领域智能问答系统的开发。实验结果表明, 在命名实体识别与意图识别模块中, 所构建模型的F1值分别达到89.17%和96.54%, 均高于其他常见模型。基于知识图谱的水稻种植智能问答系统能够准确回答农民在种植水稻过程中遇到的大部分问题, 实现了对水稻种植知识图谱数据的管理和可视化展示。
[2]
胡慧慧, 赵雪芹. 基于本体的桥梁文化遗产档案知识图谱构建研究[J]. 山西档案, 2023(6):42-57.
[3]
吴牧然. 面向网络漏洞安全的本体构建及应用[D]. 南京: 南京邮电大学, 2023.
[4]
刘桂锋, 杨倩, 刘琼. 农业科学数据集的本体构建与可视化研究——以“棉花病害防治”领域为例[J]. 情报杂志, 2022, 41(9):143-149.
[5]
王艺, 王英, 原野, 等. 基于语义本体的柑橘肥水管理决策支持系统[J]. 农业工程学报, 2014, 30(9):93-101.
[6]
CHO K, MERRIENBOER B V, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[A]. Conference on empirical methods in natural language processing[C]. 2014.
[7]
YU Y, WANG Y, MU J, et al. Chinese mineral named entity recognition based on BERT model[J]. Expert systems with applications, 2022(11): 117727.1-117727.9.
[8]
GUO X, ZHOU H, SU J, et al. Chinese agricultural diseases and pests named entity recognition with multi-scale local context features and self-attention mechanism[J]. Computers and electronics in agriculture, 2020,179.
[9]
宋林鹏, 刘世洪, 王翠. 基于词向量+BiLSTM+CRF的农业技术需求文本实体提取[J]. 江苏农业科学, 2021, 49(5):186-193.
[10]
QIAO B, ZOU Z, HUANG Y, et al. A joint mode for entity and relation extraction based on BERT[J]. Neural computing and applications, 2022, 34:3471-3481
[11]
赵泽行, 吴晓鹏, 王怡馨, 等. 基于知识图谱的农作物病虫害问答系统研究[J]. 智能化农业装备学报(中英文), 2024, 5(4):39-50.
在大数据时代的推动下,智能问答系统在各个领域得到广泛应用,为用户提供高效的答案,相比传统的文本知识收集和网络搜索引擎检索,具有明显优势。随着知识图谱技术的快速发展,智能问答系统迎来了新的发展阶段。本研究响应了智慧农业的需求,构建了一个基于知识图谱的农作物病虫害智能问答系统,旨在为用户提供与农作物病虫害相关的问答服务。主要工作包括:(1) 农作物病虫害数据获取:利用分布式爬虫框架爬取农作物病虫害相关网页数据,并进行数据清理、分析、结构化等预处理操作。(2) 知识图谱构建:对数据进行分析后,定义知识本体的实体类别与关系类别,完成知识图谱的模式层构建。利用基于规则的三元组模板对半结构化文本进行实体提取,构建数据层,并将三元组存储至Neo4j图数据库。(3) 问答算法设计:利用BERT-BiLSTM-CRF模型进行问句实体识别,BERT-RNN模型进行问题分类。匹配模板后通过Cypher语句进行查询,将答案处理为自然语言形式并返回。(4) 问答系统实现与可视化:结合农作物病虫害知识图谱与问答算法,使用Flask框架和多种web技术实现用户提问、实体识别、知识检索和答案返回等功能。试验结果表明,实体识别与问题分类模型的准确率(Precision)、召回率(Recall)和F1分别达到了93.22%、92.69%、92.21%和94.37%、93.92%、92.66%。与其他搜索途径相比,问答系统展现出了较高的准确性和稳定性。这项研究为农业信息化提供了一种智能化的解决方案,为用户获取农作物病虫害知识提供了新途径。
[12]
陈素清, 武浩, 王超凡. 基于Citespace知识图谱的农业知识语义智能检索方法[J]. 信息技术与信息化, 2024(8):212-215.
[13]
陈雷, 周娜, 朱芃璇, 等. 农业知识图谱构建数据集[J]. 农业大数据学报, 2024, 6(1):1-8.
通过信息技术提高农业生产的效率、优化农业生产中的问题对我国农业发展至关重要。目前,信息技术的发展产生了海量数据,这些数据大多以碎片化、非结构化的形式分布在网络上。尤其在农业领域,使用传统搜索引擎进行信息检索难以高效准确地获取其中有价值的农业信息,往往需要消耗大量的时间和精力从海量无组织的数据中进行二次收集和整理。针对上述问题,本文通过网络爬虫技术挖掘公开的农业网站中的数据,经过自动化或半自动化数据清洗、去噪等过程,将非结构化的数据重新组合成结构化的数据,最终以知识图谱的方式进行存储。所构建的农业知识图谱数据集包括粮食作物、经济作物、水果、蔬菜等11个农业大类、共计8 481个小类的条目数据,每个小类条目对应一种农业生物或药物。具体包括粮食作物461种、经济作物2 208种、水果1 294种、蔬菜257种、食用菌118种、花木1 161种、水产142种、农药113种、农作物病虫害1 605种、兽药519种、中草药603种。根据该数据集构建的农业知识图谱三元组达到90 508条,规模较大、覆盖品类较为广泛,能够为农业知识问答、推荐系统等人机交互友好的智能应用研发提供基础数据支撑;同时,在生成式大模型中融入农业领域知识图谱,有助于在垂直领域上实现更为高效、精准的信息检索和智能决策。 数据摘要: 项目 描述 数据库(集)名称 农业知识图谱构建数据集 所属学科 计算机科学与技术(520);农学其他学科(210.99) 研究主题 农业知识图谱;数据挖掘;人工智能 数据时间范围 2020年-2023年 数据地理空间覆盖 中国 数据类型与技术格式 *.JSON 数据库(集)组成 农业知识图谱数据包括粮食作物、经济作物、水果、蔬菜等11个农业大类、共计8481个小类的条目数据,具体包括粮食作物461种、经济作物2208种、水果1294种、蔬菜257种、食用菌118种、花木1161种、水产142种、农药113种、农作物病虫害1605种、兽药519种、中草药603种。每个大类的数据以JSON格式的文件分别保存。 数据量 14.6 MB 主要数据指标 作物类别;三元组数量 数据可用性 CSTR:17058.11.sciencedb.agriculture.00016DOI:10.57760/sciencedb.agriculture.00016https://doi.org/10.57760/sciencedb.agriculture.00016 经费支持 国家自然科学基金项目(32071901,32271981);国家基础学科公共科学数据中心课题(NBSDC-DB-20)
[14]
唐闻涛, 胡泽林. 农业知识图谱研究综述[J]. 计算机工程与应用, 2024, 60(2):63-76.
知识图谱是大数据时代下知识工程的关键技术。利用知识图谱强大的语义理解和知识组织能力,可以解决现代化农业建设中农业知识分散无序、知识覆盖范围不足等问题针对农业领域数据复杂、专业性强等特点,给出了农业知识图谱的构建方法与框架;综述了农业知识图谱构建中本体构建、知识抽取、知识融合以及知识推理四个关键技术的国内外研究现状;系统梳理了农业知识图谱在决策支持、智能问答与推荐系统的应用;最后,介绍了几个具体的农业知识图谱实例。根据农业知识图谱的研究现状,对其未来的研究方向进行了展望。
[15]
苗正旺. 农业病虫害领域知识图谱构建及知识抽取方法研究[D]. 长春: 吉林农业大学, 2023.
[16]
张永爽. 基于知识图谱的功能小麦品种推荐技术研究[D]. 郑州: 河南农业大学, 2024.
PDF(1772 KB)

Accesses

Citation

Detail

Sections
Recommended

/