卷宗式异构数据集成模型(Databook引擎)

    

Databook引擎描述

    纯java组件的富媒体卷宗式异构数据集成模型,通过该组件将桌面应用丰富的交互式用户体验与Web应用部署的灵活性和低成本相结合,采用由Web服务驱动,结合了声音、视频和实时对话的综合通信技术,使得本系统能够提供在结构化数据展现方式上同Excel完全不同的用户体验。

    我们知道Excel作为世界优秀的电子表格桌面应用,为各种关键数据提供丰富的表格展现方式。然而Excel在互联网应用上、在异构数据定制访问及数据展现上、在作为客户端数据采集功能上、在非结构化和半结构化信息展现上均存在不如人意的地方;因此Excel更多是作为一个个人的桌面应用,手工办公工具的方式出现而不是作为一个基于电子表格展现方式的软件开发工具出现。

我们的Databook则是以类Excel的操作模式和常用功能,实现异构数据的自由绑定、基于互联网的数据采集、可视化的功能拓展,从而为各种数据集成应用提供统一的信息展现和采集方式,提高数据集成平台产品的易用性和可操作性,降低数据集成平台的开发难度和开发周期。

本项目的DataBook引擎与其他类似产品对比:

比较项目

Microsoft

ThinkFree

本系统

备注

产品名称

office online

Speedsheet

DataBook

产品状态

测试

产品

产品

应用模式

ocx控件

java Applet

java Applet

windows用户

支持

支持

支持

linux用户

不支持

支持

支持

大小

3M

1.2M

400K

运行效率

工作本模式

支持

支持

支持

函数运算

支持

支持

支持

函数个数

300多个

80多个

100多个

自定义函数

不支持

不支持

支持

数据库

支持

部分支持

支持

数据库连接方式

应用服务器odbc

不支持

应用服务器JDBC

中文界面

不支持

不支持

支持

对中文内容兼容性

数据绑定方式

区域

不支持

单元格、区域

不同数据源集成

单元格动态列表

编程支持

不支持

支持

数据采集

自动分析数据结构

不支持

不支持

支持

数据库交互

自动维护数据结构

不支持

不支持

支持

数据库交互

脚本编程

支持

不支持

支持

拓展应用

自动取数

不支持

不支持

支持

数据库交互

更新数据库

编程支持

不支持

自动

数据库交互

图形分析

支持

支持

暂不支持

半结构化文档

不支持

不支持

支持

工作流集成

不支持

不支持

支持

开放接口

消息预警

不支持

不支持

支持

开放接口

权限控制

工作本

工作本

单元格

安全

信息保存

文档

文档

数据、文档

 


典型案例分析

a.应用要求分析

(本图片采集自正企互联网数据集成平台系统)

     作为税务系统的核心应用,需要针对税收管理员的税、费、社保等完成情况进行穿透式分析,以发现当前税务管理、监控重点。而针对某个具体税收管理员而言,其税费实际完成情况分布在不同系统的不同模块中,如上例中税收和地方规费数据来源于征管系统发票、申报两大模块,社保数据来源于社保系统,户管情况来源于税务登记系统,而具体纳税人的财务报表及辅助报表数据来源于申报、所得税汇算清缴系统。各个系统之间都是互相独立的产品,均由不同的开发商提供。

B.通过正企富媒体卷宗式异构数据集成模型达到的效果

    在我们的构建实例中,通过该模型简单定义后,系统能够自动根据当前操作者信息、分析时间进行数据统计,并完成不同数据之间的运算。当选择某个具体税种进行查询分析时,能自动在概况工作表中展示该税种不同纳税人的完成情况,此时选择具体纳税人,系统自动完成经济指标分析和财务数据分析,并将这些信息自由展现在指定工作表中,操作者针对分析数据完成纳税评估工作底稿的编制,编制完成后评估底稿自动保存到指定数据库中。

系统在实现逐层推进、逐层穿透式分析中,不断剥离数据的真实面貌和原始来源,实现税务数据的纵深分析,真正实现纳税人信息集中监管,将各个行业、各个系统的集成数据分析后提供给银行业、投资者、债权人等使用。

以上应用要求如果用Excel和VBA来实现则难度较大。作为桌面应用而言,可以通过Excel中的导入外部数据源方式利用ODBC数据连接实现异构数据源的读取,通过VBA编程的方式完成当前操作人信息获取,并构建当前操作人数据统计SQL,执行相关检索操作,而针对某个指标的分析工作底稿,采用多行文本方式进行备注类编辑,编辑的结果保存为本地的Excel文档。

但是这种应用存在不足:作为桌面应用不适合大规模应用;ODBC的数据连接方式带来数据库服务器的性能和安全性隐患;利用VBA编程执行效率低;同时利用Excel实现多行单元格式自由绑定则难度更大,而针对某个具体指标进行工作底稿编制则是Excel编程也难以完成的应用要求。

C.开发效率分析

    正企富媒体卷宗式异构数据集成模型除了通过非常直观的方式实现上述强大的数据集成和穿透式分析功能外,还显示了极高的开发效率。类似的系统要求,如果通过传统的VBA编程实现权限控制、自动统计、指定条件统计分析需要2个开发人员最少3个工作日以上的时间才能完成,而在我们的系统构建中,仅仅利用1个普通的设置人员(不需要了解开发语言),通过工作卷宗格式设置、数据源绑定设置、数据安全权限设置和定制脚本编写,1.5个工作日就完成了以上的全部工作。

D.特点归纳

    与定向开发模式不同,正企提供了标准的集成模型,所以非常容易上手,对使用人员的要求很低,非常适合快速推广;

可以实现复杂的功能要求;

可以实现各种异构数据的集成,包括不同操作系统、不同数据库结构、不同数据形式(结构化数据、非结构化数据、半结构化数据)的集成;

集成后的数据仓库可以实现丰富的web在线分析,并通过有效授权提供给各类使用者使用。