热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

java可视化压缩_“数据可视化”设计的视觉原理

什么是数据可视化数据的可视化其实是在用数据讲故事数据可视化由真实数据、富有美感的设计和完整的故事化逻辑组成:这三个项目既是数据可视化的构件,也是可视化流

什么是数据可视化

数据的可视化其实是在用数据讲故事

数据可视化由真实数据、富有美感的设计和完整的故事化逻辑组成:

a110a8797c1e7b73f37d4fe7ac977a05.png

这三个项目既是数据可视化的构件,也是可视化流程必不可少的环节:

  • 数据分析

    将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,获得更有商业价值的洞见和价值。

  • 视觉设计

    作为数据分析的末端整合和图形化处理环节,将不可见的数据现象转化为可见的图形符号,用大众能理解的图形语言来描述数据的内涵。

  • 讲故事

    另外可视化需要一个讲故事的逻辑,从一个宏观的问题,深入、细化到问题内部的方方面面,最终得出令人信服的结果。

数据的可视化和其他信息的可视化有很大区别,数据可视化的工具性更突出,逻辑层次的要求更强。其制作要点在于图表,但又在图表之外。很多时候不是画个简单的图表就是可视化了,通过图表工具去描述状态发现问题和并解决问题才是数据可视化的真正核心。


视觉设计

用图形讲数据

在数据分析后我们得到了数据和初步的结论,但是这戏信息太过原始和复杂,不便于传达给其他人,所以还需要对数据做可视化处理形成可视化报告。

1. 数据视觉设计原理

数据的视觉设计是用图形讲数据的过程,基本的原理如下表所示:

9760604b748c5fd48565d3400ba50e6e.png

/ 数据可视化的基本原理模型 /

1) 数据转换 

首先通过excel等工具将原始数据整理转换为数据表格,原始数据通常都会有冗余或者残缺,含有噪音和误差同时数据模式和特征往往被隐藏。通过去噪、数据清洗、提取特征等数据处理操作将数据变换为可处理模式。

2) 视觉映射 

简单来说就是给既有数据选择合适的图表,用图形语言来展现数据关系的过程。 通过视觉元素的有序组合体现数据的特征,这里视觉元素可以称为视觉通道。听起来可能会抽象,但其实内涵很简单,比如:

  • 折线图把数据特征映射到『方向』

  • 柱状图把数据特征映射到『长度』

  • 饼形图把数据特征映射到『角度』

  • 环形图把数据特征映射到『弧长』

  • 面积图把数据特征映射到多边形的『面积』

除了这些基础的图形外,其他的视觉元素也可以表示数据的特征:

5da1580bcf956963f625c7cd89f93e12.png

/ 图表原理:图表里的视觉元素 /

a. 位置 

观察散点图的时候是通过观察一个点的x坐标和y坐标以及与其他点的空间关系来确认数据点的分布和趋势。 散点图里数据的规律主要以下列四种为主:

7143fc30bde54d4277af9b1fa2138e45.png

/ 散点图里的数据规律 /

b. 长度 

以图形长度值来衡量数据大小,比如条形图(柱状图) 在制作条形图时需要注意保持图形长度的真实性,比如下面两个条形图,左边的图形以3000作为纵坐标轴起点,导致蓝色矩形长度变短,看上去蓝色矩形长度只是红色的1/4,扭曲了两个矩形的长度关系。

这显然违背了图形图表追求真实准确的可视化表达本意。需要特别提醒的是,有些文章认为修改坐标轴是一种美化数据的手段,这是错误的理念。

636c7c15350eb9df5ecc4eab1f5631d1.png

c. 角度 

饼图和环形图都是角度元素在图表里的应用类型,但二者又有所不同。圆环图和饼图一样能表现部分和整体的关系,除此之外圆环图还可以通过弧长的大小直接而明确地看出部分之间的大小比较关系,从功能性看上圆环图要优于饼图。

e70d09fe59256345c0d6c1bfc6a8e129.png

d.方向 

方向是指示动态的概念,是对一种趋势的描述,方向在图表中应用以折线图最为典型,如下图:

53defd3381f27ec45ce94dc66ac20519.png

但是方向其实是一个不够准确的度量元素,就像指针,自身只能表示上下左右的倾向,想要准确表示具体指向则需借助标尺或者参考线。

相同的数值,如果标尺有差别,那么致使方向的斜率也会出现显著差异,所以在处理多组数据的方向性时最好统一横、纵轴。

96eee9db33e9ca31d9198d02f8c70ca6.png

e. 形状 

形状主要用于在多组数据分析时区别组别,我们在日常使用时又称之为标记,比如散点图和折线图中的形状:

0978f6f0babfc5b56c5751ac8d6f9c26.png

/ 散点图里的形状 /

在散点图里使用三种形状来表现三个各自离散的数据群。

形状也可以表示数值的类型、系列和组别,比如折线图中各系列用多种不同的形状标记。

b1cc1e7d4b0c66ae84da1a1f5be33b7e.png

/ 折线图里的形状 /

f.面积和体积

大的图形代表大的数值。长度、面积、体积都可以表示数值的大小。二维平面通常用圆形和矩形,三维空间一般用立方体或球体。

但是在确定面积和体积要注意和边长或半径的数值换算问题,避免出现错误的暗示,比如:

1cea7851334110da57300bb3f610b022.png

g.饱和度和色调

颜色的两个要素,在图表中可以用表示组别,也可以用于表示等级和数值的高低。颜色要素在图表里最典型的类型是热力图,通过填色,热力图能用颜色的饱和度或者色调差别来展示数值在特定地理区域(或者页面区域)的分布。

65ac4b580641616a5f1c12cb29f816e0.png

/ 热力图:美国每10万人死亡人数变化百分比(1980-2014) /

61a2fcb987001f19581fa076bc083851.png

/ 热力图:串串香在成都的分布 /

下图被认定为是世界上最早的热力图,由法国人Charles Dupin 在1826年发表在黑白地图上,以从白到黑不同深度,标示了法国文盲的分布情况。

697b2147aeed543819bbd79fd4fe9145.png

3) 视觉元素的识别精确性

贝尔实验室在1985年发布了视觉元素的暗示排序清单:

0a6aabd743dcc1d7db6f293386f50eec.png

在很多可视化规范都沿用这份清单,清单显示在可视化设计中,位置是最为精确的元素,长度其次。柱形图对数据的表现更为准确,人也更容易理解柱形图,而热力图表现相对要差得多。

这些数据的视觉化映射原理也是设计师和数据分析师们跳出传统图表的类型框架,创造各式各样的新颖可视化作品的理论基础。

落实到在图表制作上,就是合理而准确地选择图表类型。



萤火虫沙龙3 是萤火虫沙龙的成员之一,期望大家等待!

如果失联,请关注本刊通知,感谢大家!

60bcbead0f754ec38a415bb0708dfa11.png


读取历史文章,通过目录中的文章名,点击阅读

关注我们!

----  欢迎关注:萤火虫程序员沙龙

No:19

  1. 形势“异常严峻”,紧急开会,传递了重大信号!

  2. “数据可视化”设计的视觉原理

  3. 可视化解释压缩算法的工作原理

  4. 新的证明揭示了科学知识的基本限制

  5. 理解主成分分析 (PCA)

  6. 深入理解主成分分析PCA原理

  7. 全面解读用于文本特征提取的神经网络技术:从神经概率语言模型到GloVe

  8. 自然语言处理三大特征抽取器比较

No:18

  1. 浅谈人工智能:现状、任务、构架与统一 | 朱松纯

  2. 机器学习 —— 概率图模型(贝叶斯网络)

  3. 非常全面的贝叶斯网络介绍 ,例子与其他

  4. 算法、图灵机、哥德尔定理与知识的不确定性

  5. 如何利用贝叶斯算法;推算一件事情真实发生的概率

  6. 神经网络原理的可视化

  7. 克劳斯•迈因策尔:人工智能与机器学习:算法基础和哲学观点

  8. 来自世界的珍贵的历史记录:中华民族的抗战

No:17

  1. 任正非一口气回答了30个问题(全文实录)

  2. 深度|深度学习与统计物理的通用逻辑——重整化系统

  3. 贝叶斯思想概述:从贝叶斯定理到贝叶斯网络

  4. 从贝叶斯方法谈到贝叶斯网络

  5. 谈谈统计物理学的对象和方法

  6. 熵的物理意义

  7. 趣说信息熵

  8. 信息熵、交叉熵和相对熵

No:16

  1. 神经网络和深度学习简史(全)

  2. 神经网络嵌入详解

  3. 神经网络理论基础及 Python 实现

  4. 基于深度神经网络的自动问答系统概述

  5. TensorSpace:超酷炫3D神经网络可视化框架

  6. 麻省理工解读神经网络历史,三篇论文剖析基础理论

  7. 文章目录

  8. 任正非罕见接受美国CNBC采访:华为只是中美贸易磨擦的一粒芝麻!

No:15

  1. 三种软件工程师——编码员、程序师和架构师

  2. 斯坦福完全可解释深度神经网络:你需要用决策树搞点事

  3. 前沿 | XNN:打开了自己黑箱的神经网络

  4. 神经网络之父 Hinton:AI 与医疗,是一生的信仰

  5. 入门 | 一文简述循环神经网络

  6. 进展 | 神经网络重正化群

  7. “神经网络”的逆袭:图解80年AI斗争史

  8. 凡登伯格 | 逻辑、人工智能与文化

No:14

  1. 教程 | 从字符级的语言建模开始,了解语言模型与序列建模的基本概念

  2. 语言建模的王者:AWD-LSTM指南

  3. 资源 | 从语言建模到隐马尔可夫模型:一文详述计算语言学

  4. UML统一建模语言

  5. 【软件工程】UML八大误解

  6. 51单片机串口的工作原理及应用实例

  7. PLC通讯MODBUS协议的应用及编程

No:13

  1. 从语言学到深度学习NLP,一文概述自然语言处理

  2. 软件架构发展历程分享

  3. 软件架构设计总结

  4. 从SOA到微服务

  5. 微服务、SOA 和 API对比与分析

No:12

  1. NLP基本概念及应用

  2. 哲学再思考:言语的力量

  3. 陈波 :二十世纪西方语言哲学回眸

  4. 乔姆斯基|语言哲学【访谈】

  5. 你分得清“语言哲学”和“哲学语言学”吗?

  6. NLP应该如何学、如何教?斯坦福大学大牛Dan Jurafsky教授专访

No:11

  1. DeepMind提议:贝叶斯因果网络和知识图谱,与深度强化学习融合

  2. 从自然语言处理到人工智能的两条路径(附64页PPT)

  3. 自然语言理解-从规则到深度学习

  4. 通过匹配解析树来进行自然语言理解

  5. 为《统计自然语言处理》所做的序 - 冯志伟

  6. 词向量及语言模型

  7. Kenneth Church谈人工智能和自然语言的历史、发展与未来

  8. 浅析自然语言理解之统计语言模型

No:10

  1. 医疗-人工智能专辑:AI引爆医疗领域 十张图带你了解人工智能医疗前景有多大

  2. 人工智能+医疗,国内那些不得不知的公司

  3. 人工智能在医疗领域的应用

  4. 自兴动脑医疗AI战胜10名专业医生,未来哪些工作最容易被人工智能取代?

  5. 2016-2017年度人工智能+医疗市场分析及趋势报告

  6. 2017人工智能赋能医疗产业研究报告

  7. 大数据时代下的健康医疗行业报告

  8. 医疗领域人工智能的应用

No:9

  1. Spring AOP 的实现机制

  2. 分布式一致性与共识算法

  3. 人工智能精神病专家 AI Shrink

  4. 软件架构模式

  5. Java应用架构的演化之路

  6. 敏捷项目管理的总结和反思

  7. 敏捷文档编制路线图

  8. 软件的版本控制

No:8

  1. 从语义网到知识图谱——语义技术工程化的回顾与反思

  2. 从编译原理看一个解释器的实现

  3. Java核心技术点之动态代理

  4. [算法大全] 一文读懂机器学习\大数据与自然语言处理

  5. 【中文自然语言处理前沿进展】中国中文信息学会发布《中文信息处理发展报告》,颁发中文语言处理各奖项

  6. 中文自然语言处理进展

No:7

  1. 一文读懂什么是人工智能?

  2. 深度学习入门

  3. 一文读懂自然语言处理NLP(附学习资料)

  4. 自然语言处理深度学习的7个应用

No:6

  1. 自然语言处理中的语言学

  2. 基于自然语言理解的智能问答系统

  3. 自然语言理解-从规则到深度学习

  4. 95年大神通过匹配解析树来进行自然语言理解

  5. 自然语言理解在金融领域的应用 | 尹相志

  6. 时间序列数据的首选神经网络

No:5

  1. 深度学习:原理与应用概述

  2. 一个模拟人工神经网络反馈时序运行的程序模块介绍

No:4

  1. 大牛的《深度学习》笔记,60分钟带你学会Deep Learning

  2. 一组图文,读懂深度学习中的卷积网络到底怎么回事?

  3. 从贝叶斯角度,看深度学习的属性和改进方法

  4. 机器学习算法集锦:从贝叶斯到深度学习及各自优缺点

  5. 贝叶斯机器学习路线图

  6. Deep Learning(深度学习)学习笔记整理系列之(上)

  7. Deep Learning(深度学习)学习笔记整理系列之(下)

No:3

  1. 一文读懂:什么是人工智能?

  2. 机器学习Lasso算法的前世今生

  3. 模糊性知识的语境逻辑分析

  4. 资本布局的人工智能其实是人工智障?3分钟看懂啥叫机器学习

No:2

  1. 深度学习,从前馈式神经网络起步。。。

  2. 怎样写出漂亮整洁的代码?聊聊clean code的编码、重构技巧

  3. 红黑树算法的实现与剖析

  4. 细说自动化运维的前世今生

  5. 文本分析 | 词频与余弦相似度

  6. 如何制造一台量子计算机

No:1

  1. [软件] 一个非常有用的多元函数极值问题求解算法与Java代码

  2. 程序员常读错的单词有这些

  3. 8年开发经验,网易Java开发工程师的成长感悟

  4. Java代码的编译与反编译

  5. 机器学习算法集锦:从贝叶斯到深度学习及各自优缺点

  6. 超级干货:华为花3000万引进的BLM模型


865f85b1a1864f15d736c529659646ed.png

欢迎关注萤程序员沙龙

读取历史文章,关注我们,发送期号获取

例如发送“1”,获取第一期电子

我们程序员的开心娱乐部

请关注我们公众号!




推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 基于事件驱动的并发编程及其消息通信机制的同步与异步、阻塞与非阻塞、IO模型的分类
    本文介绍了基于事件驱动的并发编程中的消息通信机制,包括同步和异步的概念及其区别,阻塞和非阻塞的状态,以及IO模型的分类。同步阻塞IO、同步非阻塞IO、异步阻塞IO和异步非阻塞IO等不同的IO模型被详细解释。这些概念和模型对于理解并发编程中的消息通信和IO操作具有重要意义。 ... [详细]
  • 也就是|小窗_卷积的特征提取与参数计算
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了卷积的特征提取与参数计算相关的知识,希望对你有一定的参考价值。Dense和Conv2D根本区别在于,Den ... [详细]
  • 本文介绍了前端人员必须知道的三个问题,即前端都做哪些事、前端都需要哪些技术,以及前端的发展阶段。初级阶段包括HTML、CSS、JavaScript和jQuery的基础知识。进阶阶段涵盖了面向对象编程、响应式设计、Ajax、HTML5等新兴技术。高级阶段包括架构基础、模块化开发、预编译和前沿规范等内容。此外,还介绍了一些后端服务,如Node.js。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 本文整理了315道Python基础题目及答案,帮助读者检验学习成果。文章介绍了学习Python的途径、Python与其他编程语言的对比、解释型和编译型编程语言的简述、Python解释器的种类和特点、位和字节的关系、以及至少5个PEP8规范。对于想要检验自己学习成果的读者,这些题目将是一个不错的选择。请注意,答案在视频中,本文不提供答案。 ... [详细]
  • 开发笔记:Python之路第一篇:初识Python
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python之路第一篇:初识Python相关的知识,希望对你有一定的参考价值。Python简介& ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
author-avatar
hizcr
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有