• 卢经理 151 5399 4549
    扫一扫,加我咨询
扫码关注我们
自动化是解决大数据迁移障碍的答案
发布时间:2024-08-15

管理数以拍字节计的信息迁移已成为企业在从非结构化数据中提取价值时所必需的实践。为了通过机器学习和AI获取见解,企业正在寻找现代化其数据迁移和管理流程的方法,他们需要高效且快速地路由数据集,以便为分析提供信息或支持产品开发。使这一活动变得可管理的关键之一是自动化数据迁移任务。

数据管理仍然是企业面临的主要挑战之一。尽管企业看到了数据在实现客户洞察和参与中的价值,但它们仍在努力实现这一目标。普华永道对CIO、CTO和技术领导者的调查发现,受访者提到的两大挑战是数据和当前系统及流程的状态。虽然几乎一半的受访者认为数据平台是业务增长的关键,但现代化,包括数据迁移和管理,仍然是一个难题。

从手动到自动化

现在流动的非结构化数据量部分是由于GenAI的结果,这促使人们对迁移和管理采用新的方法。手动迁移作为传统方法是一种资源密集且低效的数据复制方式。它需要管理员安排和维护自定义脚本,以迁移大量数据集。将数据上传到云端或本地位置也需要额外的脚本。

手动迁移无法跟上企业将数据迁移到云端以享受实时复制的时间要求。以1 Gbps的速度迁移1个拍字节的数据可能需要超过100天。在客户体验方面,例如,任何企业都无法承受长时间的等待来获取可能决定服务变更、产品定价或促销活动的客户数据。

除了缓慢迁移带来的竞争劣势外,还有数据一致性的问题。对于大型数据集,在迁移过程中源数据的更改是不可避免的。如果没有能够在数据移动过程中响应这些数据更改的自动化解决方案,企业面临的风险是错误数据到达云端或本地位置。

手动迁移方法无法支持今天企业生成的数据规模的复制。使用自动化方法可以验证数据一致性,这样无论数据发生了何种更改,使用这些数据进行分析或其他任务的人都可以确信他们拥有最新、最准确的信息。

避免中断

在大规模数据迁移期间,手动方法还可能导致本地应用程序的昂贵中断。如果涉及更改数据集,企业可能会发现无法满足其关键的服务水平协议(SLA),如一致性和工作负载的可用性等标准,这将导致员工生产力下降、客户满意度降低和帮助台工单增加。

自动化迁移和数据更改可以避免停机,同时确保本地工作负载的持续运行、数据的一致性以及履行服务水平协议(SLA)的能力。

经济收益 

在数字竞争压力下,企业纷纷投资于云服务提供商、云存储和现代化数据中心。GenAI的出现和大数据集的使用,推动了企业在AI、分析技术以及相关技术和人员上的新投资,以充分利用非结构化数据的潜力。企业无法承受低效且昂贵的方法,例如让IT人员花费宝贵的时间进行手动数据迁移。

节约资源——无论是人力还是财务资源的一种方法是使用自动化来控制与大数据集迁移和复制相关的成本,这种方法可以实现大规模数据迁移、无中断的数据更改,并且可以保护IT预算以支持新项目。

实现目标

正如普华永道的调查所指出的那样,从渴望更好地利用数据到实现这一目标需要进行一些组织变革。报告中提到,“对于专注于数据现代化的CIO来说,远不止于他们实施的技术。治理、隐私和网络安全等基础性问题对于打破组织孤岛并为企业提供全局的数据视角至关重要。”

在实施现代化、自动化的数据迁移和管理解决方案时,这些组织动态同样适用。需要考虑的一些问题包括:

当前数据系统的状态。它们是否已经现代化,以支持企业目前生成的大量数据?Hadoop因其支持大数据(包括非结构化数据)的能力而受到欢迎,它通过使任务在分布式服务器上进行分割和处理来提高处理速度,从而帮助企业更快地获得分析结果,但它可能需要大量的维护和扩展的资本成本。现代数据平台可能提供更好的替代方案。

跨企业协作的程度。如果能够用协作替代孤立思维,数据迁移、AI使用和多团队支持将更为成功,这可能包括CIO、CDO、财务、技术和销售人员,他们可能在预算优先级和哪些数据驱动的开发项目将带来最大回报方面存在冲突。

在现代数据迁移、GenAI和分析方面投资愿景的清晰度。随着每天数拍字节的数据流经企业,创建和实现一个清晰的愿景将使数据使用成为一个合理的体验,而不是每日赶进度的斗争,这将有助于通过愿景过滤器评估新出现的机会。

自动化将使数据从云到数据中心再回到云端的流动更加高效和一致。通过现代化的数据系统、团队对优先事项的共识以及整体成就愿景,企业可以克服数据挑战。