一文带你了解使用可视化技术需要考虑的问题
面对大量的数据,重要的信息往往会被淹没或误解。根据生理学研究,图形所能表达的信息远远超出了文字的覆盖范围。使用可视化技术有助于有效地使用图表并有助于构建漂亮的图表。
可视化是将数据呈现为一目了然的图形、表格等,将数据变为可视化的图形。即把专家理解和分析的大数据核心点通过图表等可视化手段向普通用户解释,直观呈现大数据的特征,将数字置于可视空间中,让人们清楚找出其中的规律、关系和模式。、特征等,从而突出重要信息。
使用可视化技术时需要考虑三个问题:
(1) 如何将数据映射到图形元素
(2) 如何组织数据进行映射
(3)如何解决数据维度的问题
如何将数据映射到图形元素
在一般的可视化中,需要映射的是数据对象、数据对象的属性以及数据对象之间的联系。
数据对象通常由几何图形表示,例如圆形、星号、十字形等。
属性的表示方式取决于属性的类型。对于具有连续值的属性,可以用位置、亮度、颜色、大小等可以连续变化的图形元素来表示;对于序数属性,也可以用位置、亮度、颜色、大小等表示,但变化不再是连续的。,所以为了区分不同的属性值,可以放大图形元素之间的差异;对于标称属性,应注意避免指示“订单”信息。图形元素表示的类型,
数据对象之间有两种类型的关系:显式和隐式。明确的关系是已知的,不需要探索。我们只需要在图中表示它们。常用的显式关系表示方法是用线来连接数据对象,或者将相关的数据对象分配给一个相同的图。特征; 隐式关系要求我们使用合理的图表和合理的数据组织进行映射,以帮助发现数据对象之间的关系。例如,在一个分类中将相同类型的数据对象一起显示可以很容易地帮助发现数据对象。关系,它们具有相似的属性值。
如何组织数据以进行映射
在一些需要映射数据对象的可视化技术中,以特定形式组织数据更有利于发现数据对象之间的联系。数据组织形式可以简单理解为坐标值(属性值)在图表的各个维度(即各个属性)上的分布。一般来说,对于连续性和有序性的属性,通常按照属性的值来排列数据显示,这样可以使图表中呈现的信息易于理解;对于名义属性,没有传统的方法来组织数据。这时,不同的数据组织形式所呈现的信息差异可能会更加明显。
如何解决数据维度问题
目前,在三维空间中只能显示图标,再加上颜色和亮度等一个属性。一般来说,一个图表最多可以显示四个属性信息。对于多属性数据,如何解决维度问题是一个值得考虑的问题。.
一种方法是只显示属性的一个子集(通常是两个属性),当没有太多属性时,可以绘制一个二属性矩阵。当属性数量多到影响图形的查看时,就需要另辟蹊径了。
另一种方法是使用降维方法,例如主成分分析(例如 PCA)。
事实上,我们一直在谈论数据可视化有两个目的:一是更好地共享和交流数据信息,二是通过设计之美有效缩短信息的交流。这是可视化的最基本目的。这里推荐新一代的数据可视化工具供自己使用——观远BI。
关于 观远BI
观远BI强大的数据分析能力,人人可用的自助BI。操作简单,专业要求低,适用范围广。近两年在BI行业口碑不错,个人版全功能模块永久免费使用!感兴趣的朋友可以到观远BI官网试用,或者联系客服获取更多解决方案、案例和模板。