智能数据时代:企业大数据战略与实战
上QQ阅读APP看书,第一时间看更新

第2章 数据的艺术

2.1 评估可能性的艺术

害怕落后是向前发展的强大动力。在今天,很多组织都致力于构建大数据和物联网,仅仅因为他们担心自己的竞争对手已经开始进行这项工作。利用差异化解决方案进入市场,吸引风险资本家的投资,是这些公司的共同目标。很多公司创业失败了,但是有些公司却在新兴市场中发展起来,甚至对部分成熟公司构成威胁。而成熟公司的CEO和高层们没有忘记在早期的市场上利用新型解决方案获得的巨大利益。

许多这样的组织开始把发展的核心集中到事实问题而不是过去的经验以及直觉方面。数据开始成为企业发展的关键,同时,从数据中得到的信息也被人们认为是关键性的东西。上述组织必须具备对所发生的事进行反思并评估的能力,而在评估一项新的选择或者决策的潜在影响时,数据分析能力变得越来越重要。

从表面来看,大数据应该帮助组织机构判断未来的发展方向。毕竟,更多的数据种类和更大的数据容量会有助于揭露新的真相,有很多公司高管也乐于相信这种价值。而且物联网似乎也开拓了新的业务可能,不仅可以用来作为对抗传统竞争者的方法,也可以应用于同质市场的新战略的开发。

因此,许多IT组织的任务是制定一个使用大数据开发新解决方案的战略,这将对业务产生重要影响。由于相似的原因,物联网也受到了同样高度的关注。如果想要确定这些举措是否有价值,常见的首要方法就是找一家在相同行业的其他公司中发生的精彩实例。另一个方法就是去查阅大量各种各样的数据,并期待好运降临,从而直接尝试得到有重要价值的意外业务发现。然而,对于通过分析数据(包括来自传感器、社交媒体、网站和其他流式数据源的数据)可能解决的业务问题,这些方法很少能在没有假设的情况下工作。

为了发展这种假说,你的公司或组织里也许应该组织一场远景规划的会议。无疑,IT的高管、企业构架师、IT架构师们会对未来IT的发展方向有着自己的观点,也充分认识到大数据和物联网的巨大潜力。然而,这些大家都想要的用例更可能只是存在于企业家们的心里。巧合的是,他们或许也会对这些项目支付预算。

在本节中,我们描述了如何探索在以后的信息构建中可能出现的东西,并且通过评估“可能的艺术”来推动未来项目的发展。当你的组织中举办过这样的会议时,也许会发现许多有潜力的项目。而且本节所概述的技巧,也会让你对这种项目的可行性形成一种可靠的预测评估。因此,你就能够将精力集中到能得到应有支持且会促进业务发展的项目上了。

图2-1强调了在我们的方法中现在所处的阶段,以及本节所涉及的内容。在远景规划会议中讨论的内容应该包括现在和未来的业务构建、数据构建、应用构建和技术构建。考虑到这只是探索过程的开始,一旦我们具备了洞察力,并确信有值得探求的项目,就会有很多后续的阶段。

图2-1 合理想象的艺术阶段

2.2 了解现状

在制定愿景之前,明白我们当前所处的阶段是非常重要的。面对这些问题时,往往总是会出现商业角度的看法和技术角度的看法。从商业角度,我们需要知道企业高管和分析师是否对现有的信息和数据满意。这常常会引起一场围绕着他们为什么和怎么样使用数据、数据粒度、可访问的时间范围以及数据质量的讨论。我们会讨论数据的来源缺失和数据历史,以及增加这些数据对容量需求在未来的影响。我们还会讨论即时数据的需求和什么是能被接受的好时机。

从技术角度,我们需要明白当前的关键数据的来源,知道这些数据是怎样移动的以及它们将去往哪里,了解现在使用的数据管理系统,以及现阶段常用或缺失的商业分析工具。除了软件之外,我们还应该知道服务器和存储器组件在当前状态结构中的功能和寿命。我们还应该了解,当业务必须响应不断变化的条件时,是否满足业务的服务级别协议以及技术基础设施的灵活性和变通性。

2.3 自我评估、完善度、信息架构

一个早期的对当前信息架构完善程度的自我评估,能使一个组织深刻认识到扩展自我当前结构的能力。如果一个组织还停留在基础数据仓库的落实阶段,那就最好不要期望通过实施大数据的项目来解决所有问题了。事实上,这样的项目可能会妨碍业务线希望尽快解决更高优先级的问题。

在出版物中我们发现了各种各样的关于信息架构的完善度评定量表。一般的组织通常走这样的路线:数据和信息仓库,数据和信息的标准化,高端业务优化,信息服务。图2-2展示了这种路径。

图2-2 信息构架完善度阶段

下面是每个阶段过程的详细阐述。

数据和信息仓库:数据在很多数据集市和工具中重复出现,主要在业务范围内进行管理,而且经常会产生哪个数据集才是真的数据集的争论。所以,所有来自数据的结论都会受到质疑。

数据和信息的标准化:集中管理的独立数据集和企业数据库由于注重数据的质量、一致性和安全性,通常被用到报告和即席查询上。IT和商业会在数据集拓展和新市场推广上进行合作。

高端业务优化:引入流数据来增强传统数据源。预测分析用于更好地理解和预测决策结果上。

信息服务:内部开发的可信赖的数据存储和分析工具,在公司和企业以外也极具价值。客户可以通过对生意伙伴提供支持,从业务运营中收益。用户乐于为享受服务而付费。

这些阶段并不总是按照一个连贯的顺序,一些组织可能同时经历好几个阶段。例如,一些组织经常在数据的存储和标准化这两个阶段之间周旋,尤其是IT行业的发展速度不足以满足来自行业不断改变的分析需求。当这种周旋发生的时候,预测分析和流动数据的增加有时会得以开发和实施。

当然,那些成功通过前三个阶段的组织会创造出难以置信的商业价值。在这一点上,一些人考虑建立“订阅”,这样就可以和他们行业的数据整合者展开竞争,因为他们开始作为服务商而提供信息了。

当你对组织的完善程度进行评估的时候,很重要的一点就是要认识到,当你作为一个服务商从存储发展到信息服务时,IT必须产生的角色和技巧变得越来越高端。开展新项目时,你应该考虑:为组织所采用的是不是一个有重要区别的技能,以及在获取这些技能时所需要的投资,是应该花在这个地方,还是应该花在其他同样赚钱却要求比较少的项目上。

在传统数据环境中,数据被存储于“仓库”里,这限制了人们获取数据的途径。与其不同的是,大数据环境建立在分布式存储的系统之中。

接下来通过运用来自各个产业的具体案例,分析了大数据对于不同产业的影响,强调了数据仓库与大数据系统这两种应用方式的不同。

了解目前的产业趋势以及最佳竞争者是如何重新定义这一产业趋势的信息构架的,对于我们构建未来信息构架是很重要的。大数据和物联网(IOT)正在许多产业中引领一场重新定义谁是真正竞争者的潮流。有些公司使用了能使受众了解数据的新方法,这种新方法使他们获得了新的业务切入点和解决方案。

最有效的信息构建方式总是与特定某类商业问题的解决相关联。下面是根据不同行业得出的数据仓库项目和包括Hadoop和IOT的信息构架清单。这份清单可能会给你带来些许探索新项目的启发,当你从事其中的某项业务时,可能会获得巨大的投资回报。

❑ 农业

数据仓库:农业生产和优化成本分析,产量分析,农产品定价分析,农产品贸易分析。

Hadoop/IOT:分析并优化耕作模式,施肥模式,收获时节,水分含量(数据来自土地里的传感器和天气预测)。

❑ 汽车制造业

数据仓库:汽车制造的成本和数量分析,供应链,汽车的保修期,市场和营销分析,人力资源管理。

Hadoop/IOT:顾客心理分析,车联网,服务需要和服务调度,驾驶历史,司机紧急监测和反应程度。

❑ 银行业

数据仓库:客户对金融产品渠道的感觉,财务分析,欺诈检测,信用价值,人力资源管理,营业网点优化。

Hadoop/IOT:欺诈检测,风险分析和客户情绪分析。

❑ 通信业

数据仓库:定价策略和财务,客户支持和服务,营销分析,供应链,物流和流程优化,合规性,营业网点优化和人力资源管理。

Hadoop/物联网:分析社交数据,移动设备使用,网络质量和可用性(使用传感器数据),网络欺诈检测,物联网中的扩展网络管理和优化。

消费性包装品(快速消费品)

数据仓库:销售,营销,供应商,制造,物流,消费趋势和风险分析。

Hadoop/IOT:促销有效性分析(通过社交媒体和店内传感器),供应链,运输过程中制成品的状态,零售产品的摆放和风险分析。

❑ 教育和科研

数据仓库:教育科研机构的财务或设施分析,人员配置和人力资源管理,校友介绍和捐赠形式。

Hadoop/IOT:风险学生分析(通过传感器数据),科研数据以及设备监控分析和优化。

❑ 医保承担者

数据仓库:护理成本,护理质量,风险和欺诈的分析。

Hadoop/IOT:客户情绪,风险和欺诈的分析。

❑ 医疗机构

数据仓库:护理成本,护理质量,人员配置和人力资源以及风险的分析。

Hadoop/IOT:疾病和流行病传染模式研究,患者检测,设备检测和优化,患者情绪以及风险分析。

❑ 高科技制造业

数据仓库:供应商和分销商分析,物流管理,产品质量和产品保修分析。

Hadoop/IOT:车间生产和质量分析,部件组装产品质量分析,产品故障和待定故障分析,自动化服务的服务请求分析。

保险(财产保险和人身保险)

数据仓库:市场营销分析,人力资源和风险分析。

Hadoop/IOT:客户情绪分析,风险分析。

❑ 执法状况

数据仓库:执法畅通,犯罪数据统计,执法人员配置优化分析。

Hadoop/IOT:威胁执法现状分析(信息来源于社交媒体和视频收集)。

❑ 媒体和娱乐

数据仓库:观看者偏好,频道收视率,广告销售额和营销促销的分析。

Hadoop/IOT:观看习惯分析(数据来自机顶盒),娱乐场所顾客娱乐方式分析,顾客情绪分析。

❑ 油气资源

数据仓库:钻井勘探成本分析,潜在勘探点,油气生产,人力资源和运输优化分析。

Hadoop/IOT:钻井检测分析(包括钻探故障预防)。

❑ 药品

数据仓库:临床试验(包括药物相互作用研究),药物测试对象结果分析,药物销售分析以及人力资源分析。

Hadoop/IOT:从来自医用传感器、普通大众的日常生活、疾病跟踪和基因组学研究的临床数据进行分析。

❑ 零售业

数据仓库:市场篮子分析,销售分析,供应链、仓库及物流派送优化分析。

Hadoop/IOT:全渠道零售分析和顾客情绪分析。

❑ 运输和物流业

数据仓库:物流和客运路线分析,营销分析,仓库选址优化,人力资源分析和优化。

Hadoop/IOT:交通流量分析(数据来自高速公路传感器),交通安全的分析和控制,设备性能和潜在故障分析(数据来自车载传感器),物流管理(数据来自物流传感器),以及客户情绪分析。

❑ 公用事业

数据仓库:传送方式的改善,(电、气等资源)运输网络供应能力的分析和提高,客户能源利用分析,人力资源分析和优化。

Hadoop/IOT:为了优化传输网络并时常进行维护,对来自智能电表的数据进行分析。

需要注意的是,上述清单仅列出了2015年决定实施或已经实施的部分项目。随着各种企业逐渐发现新方法并找到解决问题的方案,这份清单也会随之改变。

在本书的后面,我们将会讨论这些项目的优先顺序。一个项目要想获得优先地位,必须要从事与计算机信息技术(IT)相关的业务。当一个项目有了优先地位时,该项目获得成功的概率将大大提高。

在这一点上,我们已经对信息构架的成熟度进行了自我评估,同时审议了一些未来可能发展的项目。为了拓展这些项目,我们会小幅度修改现有的信息构架。举例来说,如果需要的数据大部分为结构化,并且数据仓库的基本构架是健全的,那么仅基于这一构架做出的分析可能就是完美的。然而,基本构架往往不能满足现实的业务需求,所以,当务之急是想出该如何应对日益增长的需求。

对现有构架进行修改的一个重要原因(你可能已经从本书的主题猜到)是为了新业务的需要,因为这些新型数据在传统的数据仓库中很难被分析。例如,新型数据可能包括流式数据和半结构化数据,这种数据会引入高速、大容量的数据摄取要求。这一要求可能使之前不需要的NoSQL数据库和Hadoop也被列入信息构架之中。研究Hadoop的数据科学家们也希望推进新兴数据收集工具和数据分析引擎的采用。

如何收集外界的数据需求?如何与他人合作开发未来的信息构架?一般是定期举行会议(有时称作研讨会)规划未来事物、收集客户需求。收集客户的初步需求可能只需要两到三小时,但它却可以确定我们今后要遵循的方向。

在研讨会中,参加者们会讨论当前的数据仓库、商业智能以及ETL工具和数据处理的解决方案等问题。也可能讨论包括服务器和存储器在内的基础设施,其中,对现有组件进行升级或替换往往是第一项讨论的内容。举例来说,如果目标数据仓库上的ETL所需的性能和资源出现问题,那么考虑利用流数据源所需的Hadoop集群也称为ETL引擎可能是有意义的。

事实上,Hadoop集群可以成为所有数据的初始着陆点。如果想知道如何进行预测分析或者如何重新评估预测分析的可行性,可以查阅Hadoop集群进行深入了解。

在这一阶段,很多技术工作人员可能会担心,当前我们进行信息构架的成熟度与正在规划的前景可能极度不符。IT或业务线上的技术与规划中要求的技术有明显差距,数据管理和操作问题也可能会随之出现。潜在成本和对预算的影响往往是IT高管们最关心的问题。

在初始阶段就对这些问题予以关注是有好处的。然而这只是最初阶段,我们正在构建未来信息架构可能成为什么样的愿景。我们所了解的业务案例还不足以确保全面地开展项目。同样,我们对数据细节的了解也很少。在后面的阶段中,我们将对前述业务案例和数据进行全面理解,同时也会更频繁地评估所需要的技能。在我们开始构建未来的信息架构时,将更充分地考虑潜在成本。

现在,我们只是在探索可能性的艺术。

2.4 愿景部署

这一愿景往往在促进规划的白板会议期间得到部署构建。即使是在一步步修改信息架构的最初阶段,也需要和大量主要的利益相关者进行沟通。要想了解当前架构及其组件,你应该认识架构师和IT管理员。但同时,为了应对可能出现的新问题,你们自己的业务主管和分析师也必须清楚地知道数据来源是什么。业务分析员对于数据颗粒度以及数据需要保留多长时间,与IT界可能看法完全不同。请记住,现在不是两方争辩的时候,这是汇集每个人想法的时候。

当然,这对你的会前准备工作是没有影响的。如果CIO(首席信息官)或其他高级IT领导者不定时参加业务规划会议,你就需要看一下这个组织的顶端业务优先等级,这些在收益报告、盈余报表、公司内部广播和其他的论坛里都有清晰的陈述。你也许会对竞争做同样的调查,因为公司的业务高管可能强烈地意识到竞争的存在。

在一些信息技术与业务线已经断开的公司和组织中,他们基本已失去了其他公司的信任。只有IT团队还在试图追求他们认为的能产生巨大利益的信息架构。这种努力一般只存在于单纯的研究中,因为在重新建立合作之前,他们只有少量可用资金。

为了使你的会议获得良好效果,你应该在会议之前说明会议目标和会议议程。例如,你的目标可以是希望在5年内获得早期投入,这将使公司能提供更好的服务与产品。请注意,除了IT目标,我们还有一个业务目标,如果想要让业务人员参加会议,需要提前告诉他们我们的业务目标。

会议上将要讨论的问题大致是这样的:

❑ 会议的总体目标;

❑ 与会者进行个人介绍,并介绍自己的参会目标;

❑ 对要收集的信息类型进行概括;

❑ 讨论当前信息构架的成熟度及其影响;

❑ 回顾信息构架的发展并讨论业务解决方案;

❑ 讨论什么需要改变以及为什么;

❑ 信息构架以及业务解决方案的发展愿景;

❑ 讨论下一步发展计划以及其他需要讨论的问题。

你应该在会议开始时就告诉大家计算机中输入的数据和白板上的内容都会被记录保存。你还应该在会议开始前承诺,会议结束后会将收集的信息和得出的分析报告发给大家。

2.5 现在和将来的数据仓库

IT团队可能已经列出了目前信息架构的详细图表。当我们开始研究信息架构的发展过程时,这些图表可以成为有用的参考资料。然而,在下面的介绍中,我们将简化这些图表并重点关注与前景部署有关的业务领域。

图2-3表明了当关注的焦点放在提高一家零售公司的促销和营销时,一个当前状态的足迹是怎样可能被阐明的。我们将使用同样的或类似的图表进行分析。在这个例子中,EDW(Enterprise Data Warehouse,公司数据仓库)平台提供过去的数据,多个OLTP系统(ERP(企业资源计划)和CRM(客户关系管理)系统如图所示)提供现有的数据。数据集市将EDW包围,为其提供资源。业务分析员使用报告、即席查询和分析工具进入数据集市搜集数据。图表还指出了当前我们正努力发展的部分关键技术,后面的章节将讨论这些技术。

图2-3 典型的信息架构图

在讨论这个架构图的同时,我们还可以讨论很多其他的问题,例如:

❑ 数据的当前粒度以及EDW实际保存的历史信息的广度(以及期望的广度)。

❑ 数据集市的有效性,包括数据之间的重叠、扩展或在开发新兴市场中发挥的作用,以及反映的数据的历史变化。

❑ 当前数据报告,商业智能工具以及数据仪表板的有效性。

❑ 出现重叠功能和相关用户团体,对商业智能工具所提出的要求。

❑ 在数据集市中需要的具有相似内容的数据模型。

❑ 数据预测和数据挖掘。

❑ 客户对当前数据查询和数据分析性能的满意程度调查。

❑ 提出问题或建议。

❑ 第三方数据源的重要性以及该部分数据对数据集市的适用性。

❑ 解决新问题所依靠的新数据。

❑ EDW和数据集市中对于数据质量的当前要求和未来要求。

❑ 数据更新频率以及向EDW或数据集市及时传送数据以做出业务决策的能力。

❑ 对数据安全性的关注,包括静态和动态的数据。

❑ 对更高可用性的EDW和数据集市的需要。

注意

如果其他的架构师对你的架构提出修改,你应该感到高兴,做出标记,并让他们画出自己的版本。他们所画的信息架构可能与我们本章中提供的插图有很大不同,你可以从他们的版本中受到启发。这将汇集共同智慧,并更好地合作以构建一个我们未来架构的共同愿景。


你应该尽可能多地收集信息,并根据需要在白板上做出标记。为了使每个参会者都能理解会议内容,你应随时记录数据集市、数据来源和其他数据组件的名称。

就像上文中指出的那样,我们在会议中也可能会讨论数据安全的问题。一些讨论将由该组织所属行业的独特需求驱动。如果你在某些特定领域或者政府机构中工作,你可能对该特定行业的安全要求有所了解。但是,如果你在许多不同的行业中进行咨询,表2-1可以提供对常用标准的一些有用的描述。

表2-1 不同领域的数据安全标准示例

你还可以根据需要向业务分析员咨询,他们会根据你的要求在沙箱的隔离下浏览各种数据。以前,这些沙箱一般会应用在EDW或一次性数据集市中。现在,出现了使用自己的数据管理引擎或使用Hadoop进行数据管理的信息发现工具,这些新型工具有利于更灵活、更及时地探索新数据,因为它们是“无模式”的,也就是在使用前不需要预先设置它们的模式。

图2-4将信息发现工具添加到我们当前的数据仓库体系结构中。了解这些工具带来的商业智能可以帮助我们更好地利用Hadoop集群中的数据,使用这些工具也可以推动数据集市和传统商业智能工具的发展。

图2-4 从架构图中发现的信息

你应该从业务分析员那里收集他们认为能带来有形商业利益的数据报告和分析视角。他们能够告诉你不同行业中最具实用性的数据,或者提供一些有助于研究自己所在组织的分析效率的信息。这些信息在今后详细讨论如何确定具有竞争力的项目业务时会显得更为重要。

1.确定Hadoop和NoSQL的适用范围

我们现在正在探索扩展信息架构,使其能够包含Hadoop和NoSQL数据库。与使用关联数据库相比,这一技术在处理流数据源和半结构化数据源时可能会更为有效。

你的公司可能与许多其他组织一样,已经开始研究这项技术的价值。如果你们有这样的项目,你需要记录试验过程并在此基础上探索新问题。举例来说,如果Hadoop原型正在进行或者Hadoop已经是生产环境的一部分,那么你可以探索下列问题:

❑ 将数据源导入数据集群。

❑ 加载于Hadoop集群的数据所代表的历史长度和容量。

❑ 需要加载到Hadoop集群中的其他数据源。

❑ 被存储的数据对数据量的影响。

❑ 当前和未来的计划数据摄取率。

❑ Hadoop集群的计划工作量(包括MapReduce、SQL查询、Solr/搜索、预测分析、ETL等)。

❑ 当前和未来计划使用的分析工具(商业智能、信息发现、搜索、预测分析、ETL等)。

❑ 现有的数据处理能力以及所带来的商业价值。

❑ 数据(包括静态数据和流动数据)的安全问题。

❑ 集群数据的可恢复性和可用性。

图2-5说明了有多少具体项目利用Hadoop来进行分析。该图展示了一个零售商店的Hadoop分析模式。其中,以大数据分析为基础的努力,被看作与之前存在的数据库和它周围的基础设施是完全分离的。

图2-5 在独立的研究和发展努力中的Hadoop和NoSOL数据库

在上述零售店的例子中,我们的目标就是要更好地理解和促进销售。当购物者进入网页或者进入实体店购买商品时,各种数据就会被捕获然后被Hadoop收集,购物者的情绪数据也从社交媒体上收集于Hadoop中。这些流数据会先进入NoSQL的数据集群(可以轻松地扩展到高吞吐量需求),然后再进入Hadoop中获得初步分析。

这些来自传感器的数据在物联网的架构视图中被大大简化,缺少了很多内容,包括配置、安全性能和其他必要服务等。我们要努力去做的,就是尽量促使所有分析工具以及各项流程相互配合、互相协作,从而发挥更大的作用。

2.链接Hadoop和数据仓库的基础构架

接下来,我们将讨论是否需要在同一时间查询和分析传统数据仓库和Hadoop集群中的数据,以及为了满足业务需要,收集结合数据源的频率等。了解这些内容将有助于我们确定未来最佳分析方式。

例如,如果我们的业务分析员为了展开业务,需要维度建模,那么我们要将有用的数据从Hadoop集群移动到数据仓库中,或者创造一个基础构架,使Hadoop集群作为数据仓库的扩展存储空间。如果我们计划构建一个包含Hadoop和数据仓库的预测性分析平台,就要在Hadoop集群中完成对所有数据的分析工作。正如之前提到的,我们将从商业分析师那里,收集那些通过整合分析这些来源各异的数据而得到的潜在商业利益。

图2-6说明了Hadoop和NoSQL数据库是如何成为当前信息架构中数据仓库的一部分的。因为我们会利用Hadoop进行ETL处理,所以可以将企业数据仓库的直接数据源映射为Hadoop的数据源。下图同样也是较为简化的版本。

图2-6 Hadoop和NoSQL数据库与数据仓库基本构架的链接

引申出来,可能会出现关于应将数据存储于什么地方的争论。这些新数据是否应该先在云中进行分析?数据是否应该被储存于包括数据仓库和Hadoop集群在内的内部基础架构上?

数据量和在网络(有线宽带)传输中所需的流量将帮助你确定在云、本地部署以及混合模型中的数据是否是最合适的。为了了解数据移动量,你需要了解各种数据管理系统以及如何利用它们进行数据查询和分析。这些问题随着以后构建信息技术架构的展开,我们会再详细讨论,到那时,你将会对业务用例有更深的了解。

注意

很多组织使用云来加快Hadoop、NoSQL或数据仓库的研究和开发工作,尤其是在不了解业务价值的情况下,考虑到日益增长的数据容量和全部生产基础设施的用户化要求,企业一般会选择自建基础设施。

2.6 实时建议和操作

图2-6所示的基础设施呈现出数据因为点对点的移动所带来的时间延长,而对于业务遇到的某些问题,可能需要实时的建议和响应行动。比如说,你希望购物者在进入购物页面时就能看到你推荐的产品,而不是已经离开购物页面才看到推荐的产品。

实时推荐引擎的作用就是在网络商店里引导购物者购买特定的商品。在Hadoop集群或数据仓库中可以构建关于购买行为的预测分析模型。构建模型的目的在于对购物者进行更巧妙的指引,使他们能够买得更多并且更快地找到想要的东西。推荐引擎中的模型会随着购买模式的变化不断更新,也会不断完善。

在配置智能传感器和控制器的地方,对及时行动的迫切需要或许表明有些规则的建立是为了在所有分析发生前促进行动。这就是为什么事件处理和业务规则引擎通常被列为智能传感器解决方案的一部分。举例来说,如果实体店中的传感器在与收银员和那些由于感到不满而放弃购物的顾客取得联系时出现延迟,预先设定的规则就会触发装置来通知那些忙于其他事情的收银员再开一个新的收银台。

图2-7说明了在网站中加入实时推荐引擎,该推荐引擎由在Hadoop集群中运行的数据支撑构建并根据数据的变化定期更新,购物者的个人资料和定位信息由此被传到引擎中。具体的实时建议最后由网站传递给购物者。

图2-7 信息构架中的实时推荐和事件处理系统

我们还在图中展示了实体店中的闭环系统和业务规则。当购物者们进入他们手机上的购物app(应用软件)时,我们就开始监控他们的浏览踪迹,这样销售人员就可以根据购物者在网站上最近的浏览信息来向他们推荐商品。

刚才所列的示意图带有一定的技术性,所以业务分析员要想理解它可能是有些困难的。但是我们认为正是这样的示意图,才有助于业务分析员了解当前基础设施和数据流的局限性,并且可以帮助他们寻找当前问题的解决方案。这些示意图还可以使业务分析员尽早修改需要的业务解决方案。

2.7 验证提出的愿景

规划会议在结束时往往会在白板上绘制当前和未来状态的信息架构图,这些架构图在最后都会被手机拍下。有时这些图表也会被保存在从活动挂图撕下来的活页上。会议进行时,主办者还应对业务线、IT业高管层、架构师以及其他任何人员的发言进行记录并作出相应注释。这些记录中可能会包含一旦未来信息架构部署好后,对商业决策产生有利影响的假设。

下面我们来介绍如何对所收集的信息进行总结。首先,这些信息应该以报告或演示的方式反馈给参加会议的人员,这种形式既可以验证主办方是否记录了会议中各方表达的所有重要信息,同时,如果总结中有不清楚的地方,发言人也可以及时得知并作出相应澄清。通常情况下,在一周或两周内将信息报告分发给参会者是最有益的,因为这样可以加强在讨论会议中形成的团队合作精神。

在一些场合中,有人向我们提出,应该邀请大量不同的受众参加以总结前期规划会议为目的的后续会议。这种情况时有发生,因为参会者会就在会议中讨论的未来信息架构等问题与别人进行分享,所以很多其他涉及此方面利益的人在了解到我们讨论的内容以后也会产生兴趣。随着影响逐渐扩大,很多其他业务领域的人也希望能够参加并记录他们的想法和要求。这是一个好现象,人们会认为这一项目越来越有价值并予以更多资助。后续会议更侧重于进一步的探索,而不是解读、验证前期工作。所以要想解读、验证前期工作,较好的方法是提前修订报告并另行安排会议讨论对报告的验证和修订问题。

基于规划会议所做的报告或演示应包括以下内容:

❑ 目前的业务难题,包括信息构架带来的难题。

❑ 对当前的信息结构所做的描述和绘制的图表。

❑ 新兴业务需求,业务模式变化预期以及如何运营业务。

❑ 可以满足需求并应对挑战的未来信息架构图。

❑ 通过未来的信息架构可能获得的商业利益(理想情况下包括这些收益的可能财务规模)。后续步骤将会在本书的后续章节中介绍。

我们注意到个别组织的IT架构师想在收集完信息后立即开始详细设计信息架构的工作。然而,对于信息架构,很多问题目前仍然处于未知状态。例如,我们还不知道如何展开运营,关键的绩效指标是什么,该采取怎样的措施。我们也不知道在各个阶段如何实施解决方案以及有没有阶段实施优先级等。

虽然对于如何寻找业务案例会有一些初步想法,但是目前为止,我们还没有一个可靠的指导案例。并且我们对于哪些数据源将提供有效措施,哪些数据反映KPIs(关键绩效指标)了解得太少。再者,我们还不能确定我们缺少的技能对于实施和管理解决方案并利用它有效地运营业务有什么影响。

通过这一点我们得知,要想对一个项目获得充分了解,我们仍需要更多的实际探索和书面佐证。但至少现在,我们已经对修改信息架构的实用性和可能性有了一些初步概念。而且我们还知道应该去哪里寻找商业赞助。因此,我们接下来要做的就是与业务链伙伴合作,进一步发掘需求。