尽管数据和存储容量正在以越来越快的速度增长,但组织这种复杂性的需求可能变得越来越困难,环境影响也是如此。然而,为了满足人工智能的需求,选择降低能源消耗的基础设施可以帮助组织解决这些挑战。
关于大数据的技术方面,应该记住大数据工具和技术是互操作和无缝的。因此,“冷数据”的概念已经不存在了。然而,如果我们更加乐观,我们可以谈论“温暖”的数据,这些数据应该根据数据科学的需求立即可用。
通过容器化赋予数据科学家权力
快速存储将成为唯一解决方案,以满足人工智能运算成功所需的可用性。这是因为将人工智能模型与数据连接起来意味着采用一种存储解决方案,可以确保数据的即时可用性和快速访问,甚至在不同服务器之间也可以实现快速访问 – 如果使用硬盘存储解决方案,通常是一项繁琐的任务。
签署科学可持续目标的公司数量的增加只是迫使它们重新考虑存储引起的环境影响的推动因素之一。数据所有者目前面临的新问题是存储需求旺盛的人工智能,通过高效节能的技术来解决这个问题的实施有助于应对它。
对许多组织来说,一个必不可少的问题是监控和报告它们的第三方范围的排放量,这些排放量包括从上游到下游的环境成本。人工智能的发展与数据大量增加有关,增加了存储系统的负载。与能够提供解决方案以满足电力和冷却需求并解决空间生成问题的供应商合作是应对这一挑战的最佳方式。
人工智能数据之旅
数据科学家经常花费大部分时间对数据进行预处理和探索。现在,他们需要所有的设备、材料和工作站,以便在需要时高效地完成工作。
Python和Jupyter Notebooks已经成为数据科学家的日常语言和工具,所有的数据摄取、处理和可视化都有一个共同点 – 它们都可以适应所谓的容器中。事实上,为了实现这个目标,支持实施阶段的平台应该能够满足人们的需求,而无需将工作分散到不同的工具上。
据451 Research称,现在约有95%的移动应用程序都是使用容器构建的,这对于数据科学家来说已经成为一个至关重要的角色,他们需要这样一个后端提供快速和高效的交付。然而,如果管理层不这样做,结果将是这些过程变慢。在某些情况下,数字化转型可能被视为一个失败的过程。因为它涉及到企业的方方面面,所以数据科学部门的问题将会影响到业务的各个方面。
IT部门在人工智能方面面临的主要问题之一是市场发展速度不合理,这意味着将学习企业的工作周期交给废纸篓。新的人工智能模型、框架、工具和方法的出现对人工智能的内部软件和硬件引擎产生了巨大影响,包括可能出现的大量技术成本。
人工智能数据之旅是数据生命周期中的一个重要阶段,伴随着我们朝着人工智能之路迈出的每一步,都会生成元数据。为了实现这一目标,需要增加大量新的基础设施来应对人工智能发展的速度。
本文摘自Diginomica。