观远数据是如何实现任意连接数据的
为什么需要丰富的数据连接?
众所周知,无论是做数据可视化的报表,还是挖掘数据更深层次的内涵,获取数据是企业一切数据分析的前提。数据不断更新。目前大多数企业将数据存储在数据库中,使用数据库数据制作报表,报表内容会随着数据库的更新而更新。数据分析工具通过数据连接建立与各种数据库和文件到系统的连接,为后续处理分析提供数据支持,因此数据连接是数据分析软件不可或缺的能力。
观远BI数据连接支持
目前一些主流数据库大致可以分为以下几类:关系型数据库(RDBMS)、多维数据库(OLAP)、大数据库(BIGDATA)、本地文件、非关系型数据库(NOSQL)等,那么这些是否数据源是否支持以及如何支持,也成为了选择BI工具时的考虑因素。而观远BI基本支持访问上述各类主流数据库。
通俗地说,数据连接就是在BI工具和业务数据库之间建立连接。观远BI丰富的数据连接能力,可以通过创建数据源快速连接企业的业务数据库(注:这里的数据源是指创建业务库和产品应用服务器的连接,获取数据分析),构建统一的数据分析平台。
那么观远BI支持访问的具体数据库有哪些呢?
一:本地数据
1)支持将Excel、CSV、TXT文件、数据分析包直接上传到缓存库或关系数据源。可以导入的目标关系数据源有:MySQL、Oracle、DB2_V9、MSSQL。另外,在导入文件数据时,可以选择新建表或者覆盖源表的数据,方便数据更新和维护。
2)支持访问Java数据源,是指用户通过二次开发编写JavaQueryData接口实现类,实现自定义数据结构的一类数据源。特殊之处在于 Java 数据源没有物理数据库来存储其字段和数据。但它可以使用该类解析任何包含数据的文件或报告并将其应用于观远BI。
二:关系数据库
关系数据源是指通过 JDBC 驱动程序连接的关系数据库。主要以二维方式组织,实现二维查询。除了传统的MYSQL、Oracle、MS SQL Server等,现在大数据分析是一种趋势,观远BI支持各种大数据库如:Presto+Hive、Star Ring、Vertica、Infobright。具体支持的关系数据库类型如下:
三:多维数据库支持
多维数据源是指数据以多维数据集(即Cubes)的形式组织起来实现多维数据集的一类数据源。它通过多维结构对关系数据源中的数据进行聚合和组织,实现对数据进行动态分析的一类数据源。多维数据源是创建多维分析报告的基础。
系统支持的多维数据源如下:
四:非关系型数据库——NoSQL数据库
MongoDB作为非常流行的NoSQL数据库,应用越来越广泛,观远BI无需安装插件即可支持创建Nosql数据源,直接连接MongoDB和Tinysoft这两个非关系型数据库。
总之,观远BI可以打通各种数据源,丰富的数据连接能力,可以抓取各种数据源的数据进行分析,除了支持Oracle、SQL Server、MySQL等常用的关系型数据库,非关系数据库、多维数据库、本地文件如:Excel、TXT、CVS。此外,它还支持具有自定义编写接口的 JAVA 数据源。
从数据连接能力来看,观远BI对企业数据平台的连接能力更强,还在各个版本的发布中不断更新。
观远BI数据连接亮点:
1.跨数据库联合数据源
该系统支持访问如此多类型的数据库。如果业务实现跨库查询,可以直接使用内置的跨库联合数据源。系统自动将新建的关系数据源信息添加到跨库联合数据源中。跨数据库数据源支持用于数据集定义,通常广泛用于数据模型中。
2. 缓存库
观远BI提供一个缓存库来解决性能问题。缓存库的作用是解决用户原始数据库查询速度慢、难以解决的问题。可以通过定时抽取将数据缓存到缓存库中,提高报表的查询性能。