基于云数据中心的多源异构数据治理技术研究
DOI:
作者:
作者单位:

92941部队45分队

作者简介:

通讯作者:

中图分类号:

基金项目:


中图分类号:TP206.3 文献标识码:A
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    目前常规的多源异构数据治理方法主要通过对数据属性进行判断,从而实现分区域数据清洗,由于缺乏对非线性数据的分析,导致治理性能不佳;对此,提出基于云数据中心的多源异构数据治理技术。采用关系型数据库中的ETL功能对数据进行清洗,对数据转换模式以及数据清洗规则进行定义;引入互信息系数对数据相关程度进行判定,并进行非线性数据相关性分析;以云数据中心作为载体,对多源异构数据治理体系进行构建;在实验中,对提出的数据治理技术进行了治理性能的检验;最终的实验结果表明,提出的数据治理技术具备较高的查准率,对云数据中心多源异构数据具备较为理想的数据治理效果。

    Abstract:

    Current conventional multi-source heterogeneous data governance methods mainly judge data attributes to achieve sub-regional data cleaning, which leads to poor governance performance due to the lack of analysis of non-linear data. In this regard, a multi-source heterogeneous data governance technique based on cloud data center is proposed. The ETL function in the relational database is adopted to clean the data, and the data transformation mode as well as the data cleaning rules are defined. Mutual information coefficient is introduced to determine the degree of data relevance, and nonlinear data relevance analysis is performed. The cloud data center is used as a carrier to construct the multi-source heterogeneous data governance system. In the experiments, the governance performance of the proposed data governance technique is examined. The final test results show that the proposed data governance technique has a high checking accuracy rate and a more ideal data governance effect.

    参考文献
    相似文献
    引证文献
引用本文

孙瑜.基于云数据中心的多源异构数据治理技术研究计算机测量与控制[J].,2024,32(3):286-292.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-08-20
  • 最后修改日期:2023-09-09
  • 录用日期:2023-09-11
  • 在线发布日期: 2024-04-01
  • 出版日期: