集中还是分布?
当说到数据集成时,很多人会首先想到银行的数据大集中。不过苏发希望强调的是,大唐集团的数据集成与银行的数据大集中有本质不同。
在苏发看来,如果将所有下属企业的数据全部物理集中到大唐集团总部,那总部的数据存储量和维护管理工作量可能不是总部信息化部门所能承载的。在大唐电力的数据平台上,将数据分为三个级别分布式存储。最终的物理数据在所有下属基层企业的应用系统和数据库中;省一级的二级机构会根据业务需要实时采集部分数据,并在本地存储部分需要存档的数据;集团总部则可以根据业务需求从基层企业或二级机构实施采集需要的数据,并存储部分数据。目前大唐电力下属76个运行电厂的生产信息都可以在集团总部的调度大厅中实时显示。
数据是集中存放还是分布式存储一直以来都是争论的焦点,尤其在看到银行数据大集中的弊端之后,一些人对数据的物理集中效果表示怀疑,通信质量、数据中心的稳定性都可能会影响日常的业务运行。不过银行的数据集中的特殊意义在于,当涉及异地存取等业务时,如果数据是分布式存储,那异地银行之间的数据共享和交换太复杂,反而物理上集中在一起使得数据的同步和一致更容易实现。
在国外,确保银行数据中心可靠、稳定的基本措施是加强负载均衡、数据镜像、灾难备份等保障,银行数据大集中所带来的负面影响完全可以靠技术来解决,只是更多的数据库集群、更安全的灾难备份中心都是靠钱垒起来的,管理人员的投入也是巨大的开销,没有足够的资金投入显然集中的效果会削弱很多。
因此对数据集中还是分散的争论,最后似乎应该归结到是否所有的业务数据都值得斥巨资进行物理集中。Sybase软件(中国)有限公司总裁俞伟强在接受记者采访时表示,数据整合与集中是两码事,将所有异构数据库进行实时整合,已经能够满足相当多应用的需求。
上一篇 : 独立电商或将是电子商务的新未来
下一篇 : 板栗 “6个栗子等于1碗饭” 板栗吃多了易发