数据优化过程需要战略规划、遵守内部政策以及持续改进。
实施数据优化技术之前,组织应评测其当前的数据、流程和技术。在此基础上,您将确定新的目标和关键绩效指标(KPI),以识别哪些数据优化技术适用,并证明其可衡量的结果。
建立数据治理
开发数据治理框架是数据优化的第一步。数据治理涵盖诸多程序和策略,用于确保数据处于适当状态,以支持业务举措和运营。数据治理明确数据使用的角色、责任和标准。
通过使用数据治理框架优化数据,组织可获得以下益处:提升可用性、增强可扩展性、降低风险、促进利益相关者协同以及确保合规性。
实施“数据即产品”方法
数据即产品(DaaP)方法将内部数据视为商业产品,采用相同的管理技术进行处理。DaaP 包含明确的产品负责人、界定的职责范围、经批准的数据供应商、既定的标准规范、成熟的设计模式、全面的文档记录、清晰定义的数据集和数字记录,以及贯穿整个数据生命周期的强健治理结构。
这种系统化的数据管理方法通过高质量、易于获取的 DaaP,助力内部和外部用户实现数据优化。
设置数据目录
数据目录对组织收集和处理的所有数据进行盘点,并将这些信息存储于一个位置:数据目录。建立数据目录可使数据更易于访问和发现,从而有助于数据优化。
建立数据目录可减少数据冗余、促进协作、增强可扩展性以及实现自动化。当元数据标准得到执行时,数据目录还将提升数据质量。
集成您的数据
数据优化的关键原则之一是可访问性。使任何数据可访问的最快捷、最简便且最经济高效的方式是将其迁移至云的集中位置。迁移至基于云的数据湖屋,既融合数据湖的灵活性,又兼具数据仓库的数据分析能力。
数据湖屋的优势包括统一的数据访问、可扩展性、增强的协作能力、互操作性以及高效的资源使用率。
设置自动化
为协助实施数据优化技术,借助合适的数据优化工具,几乎可以实现优化流程各个环节的自动化。选择合适的数据优化工具取决于具体的使用案例以及所需的优化技术。
自动化工具可用于数据优化,涵盖集成与 ETL、数据质量与清理、治理与目录管理、存储与压缩、数据处理、工作流程自动化与编排,以及数据库与查询优化等领域。
确保可扩展性
使用可扩展资源,确保组织充分利用多种数据优化技术提供的资源配置效率优势。基于云的数据存储、处理和分析可通过适配实例和按需处理,助力实现数据优化的可扩展性。