跳转到主要内容
Chinese, Simplified

构建从任何类型的源(包括Web和社交源)收集数据的解决方案。 借助这些解决方案,您可以使用分析引擎来存储,分析和报告数据,从而推动可操作的洞察和可视化。

数据是基础


管理数据如此具有挑战性和复杂性的原因在于,数据本身并不起作用。 数据是惰性的; 它不是自我组织甚至是自我理解。 在DIKW金字塔中,数据是感知有用性最少的基础。 信息的价值高于数据,知识的价值高于信息,智慧的价值最高。 数据需要其他东西 - 程序,机器,甚至是人 - 来提升价值链并成为信息。

IBM AI Ladder也从数据开始。当您在数据之上执行分析,机器学习或人工智能等业务辅助功能时,您将获得更高的业务价值。正如IBM总经理Rob Thomas在他的博客“数据科学更快”中所说,“没有IA(信息架构)就没有AI。”

 

 数据本身是惰性的。数据需要软件(或人员)使数据显示为活动(或可操作)并产生积极,中立或消极的影响。
Neal Fishman,SOA中的病毒数据:企业大流行,IBM出版社


收集,组织和分析数据


今天,我们的用户可能可以访问太字节,千兆字节甚至数十亿字节的数据。但是,如果不收集,组织,管理,控制,丰富,管理,衡量和分析数据,那么这些数据不仅无用 - 它可能成为一种负担。

这些活动构成了数据和分析平台的焦点,如IBM Analytics产品的三大支柱所示:

  1. 混合数据管理
  2. 统一治理与整合
  3. 数据科学业务分析

Three pillars of IBM Analytics

数据作为差异化因素


您的数据需要成为公司资产。数据有能力改变您的组织,增加货币价值,并使您的员工能够完成非凡的事情。数据驱动的文化可以实现更高的业务回报。

你可以在没有太多计划的情况下建造一座狗屋,但你不能用同样的方法建造一座现代化的摩天大楼。复杂混合云拓扑中保留数据的规模需要规范,即使对于采用敏捷和适应性理念的组织也是如此。

数据可以而且应该用于推动分析见解。但是,需要哪些考虑因素和计划活动才能产生洞察力,采取行动的能力以及做出决策的勇气?尽管最大限度地提高数据实用性的规划和实施活动可能需要深入思考,但您的组织可以在短时间内以数据为中心和数据驱动。

企业需要迅速行动。您的组织必须尽快响应不断变化的需求,否则就有可能变得无关紧要。这适用于私人或公共组织,无论大小。

数据和相关分析是区分的关键,但传统方法通常是临时的,天真的,复杂的,困难的和脆弱的。这可能导致延迟,业务挑战,机会丧失以及未授权项目的增加。

使数据启用并激活


启用和激活数据有五个关键原则:

  1. 制定数据战略
  2. 开发数据架构
  3. 为分析开发数据拓扑
  4. 制定统一治理方法
  5. 开发一种最大化数据消费可访问性的方法

如果数据是推动者,则可以将分析视为正在启用的核心功能之一。

分析可以是一个复杂且涉及的学科,包含广泛而多样的工具,方法和技术。 IBM AI Ladder的一端是通过静态格式的数据启用的,例如预建报告;另一端是通过深度学习和先进的人工智能实现的。在这两端之间,启用方法包括诊断分析,机器学习,统计,定性分析,认知分析等。机器人,软件界面或人类可能需要在单个任务中应用多种技术,或者跨越他们在驱动洞察力,采取行动,监控和制定决策时所执行的角色。

管理开发生命周期


大多数组织需要管理软件生命周期。 上面列出的关键原则意味着需要一个单独的数据生命周期,因为任何关键原则的结果或可交付成果都不应被视为静态和不可变的。 与数据一样,您可以将分析视为具有独立于软件生命周期和数据生命周期的自己的生命周期,尽管它们都是互补的。

为了帮助实现数字化转型,您的组织应采用三个开发生命周期:

  1. 软件应用
  2. Analytics(分析)
  3. 数据

Purpose-driven development lifecycles

每个开发生命周期都代表了一个迭代工作流,敏捷开发团队可以使用它来制定更高价值的业务成果。生命周期通常是时间盒迭代,可以遵循快速失败的范例来实现有形资产。速度在业务中很重要;大多数企业都在努力快速满足新的需求。每个生命周期迭代的目标是在最大化业务价值的同时高效,熟练地解决业务速度问题。

软件/应用程序开发生命周期(SDLC)是众所周知的,它支持传统和敏捷开发。 SDLC重复整合业务需求。

分析开发生命周期(ADLC)支持IBM AI Ladder中的全部分析工作。此生命周期包含模型开发和修复,以避免漂移。由于分析的目的之一是实现行动或决策,因此ADLC依靠反馈机制来帮助增强机器模型和整体分析环境。反馈机制的一个示例是捕获关于行动或决策的积极或消极影响或结果的数据点。 ADLC迭代数据。

数据开发生命周期(DDLC)将数据管理理念置于一个有机且不断发展的循环中,更适合于不断变化的业务需求。 DDLC受SDLC和ADLC的影响。它迭代了业务需求的整合和数据的表现。

虽然这三个生命周期是独立的,但您可以将它们结合使用并建立依赖关系以帮助推动业务成果。每个生命周期都应该是敏捷的,并且应该合并到DevOps流程中以进行开发和部署。

 

Value-driven development lifecycles

三个生命周期的交叉点突出了统一治理的必要性。软件/应用程序和数据之间的交集突出了信息的集成和访问路径。数据和分析之间的交集突出了集成和底层数据存储。分析和软件/应用程序之间的交集突出了集成以及API或其他数据交换技术的使用,以帮助解决复杂的算法或访问要求。

使用DataFirst进行云的Garage方法


组织中的每个部门对数据和分析都有不同的需求。您如何开始数据驱动的旅程?使用DataFirst实现云的Garage方法可提供策略和专业知识,帮助您从数据中获取最大价值。此方法从利用数据和分析而非技术的业务成果开始。以协作方式定义焦点是获得早期结果的关键。您的路线图和行动计划将根据经验教训不断更新。这是一种迭代且敏捷的方法,可帮助您定义,设计和证明针对特定业务问题的解决方案。

continuous innovation cycle of the DataFirst

下一步是什么?


现在您已了解数据和分析的概念和价值,了解如何在数据和分析参考架构中设计数据和分析应用程序。

原文:https://www.ibm.com/cloud/garage/architectures/dataAnalyticsArchitecture

本文:http://pub.intelligentx.net/data-and-analytics-insights-and-visualization

讨论:请加入知识星球或者小红圈【首席架构师圈】

Article
知识星球
 
微信公众号
 
视频号