
什是大数据?数据与信息的区别,数据的功能
数字经济时代,数据、信息、大数据等概念逐渐被大家熟悉,那么什么是大数据,数据与信息又有什么区别,数字的功能又有哪些呢。
下面就我学习中国科学院研究生院孙毅博士的《数字经济学》(机械工业出版社)所了解的“数据”与“信息”及大数据的概念和数据的功能与大家分享,希望老师和同行们多多批评指正。
国际标准组织的定义:数据是指搜集到的、原始的、未经处理的关于客体的事实;信息是指对人们有意义的数据,是数据经过提炼、加工、整合后形成的关于事实、事件、事物、过程的思想和知识,其在特定语境中有特定的含义。大数据是指一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有数据规模海量(volume)、数据流转高速(velocity)、数据类型多样(variety)和价值(value)密度低四大特征,简称“4V”特征。
“数据”不等同于“信息”,二者之间存在着一个梯次关系。“数据”强调“信息”的一种更加原始的状态,保留了更多原始的“信息”,人们通过“数据”可以挖掘更多的“信息”。“数据”比“信息”更为根本,而信息则是经过加工后,有逻辑、有意义的数据。“数据”是纯粹的“事实”,具有无修饰的、独立的性质,通过上下文和周围环境的相互作用,这些“数据”(或“事实”)在一个具体的、特定的背景环境下,进行释义后成为人类所定义的“信息”。比如在网络治理语境下,经常使用的“违法有害信息”,以及在个人信息保护语境下的“个人信息”,都是指向内容意义本身。2021年6月10日,第十三届全国人民代表大会常务委员会第二十九次会议通过了《中华人民共和国数据安全法》,其中关于“数据”的定义是“本法所称数据,是指任何以电子或者其他方式对信息的记录”,强调数据是信息的存在形式或记录本身。
数据可以从不同的角度分成多种类型。例如,我们可以从数据主体(指数据或信息在网络中以各种方式加以披露的自然人)的角度把数据分为个人数据(涉及财务、健康、文化、生物特征以及能辨识出特定自然人的多种类别的数据)和非个人数据(商业、政府等相关数据)。目前国家间协议、国内法规等,在谈及数据时,主要内容是指个人数据。随着数字经济的快速发展,数据的内容不断丰富,逐步扩展到商业数据、政府数据等方面。
尽管“数据”和“信息”两个概念的语义是有所区别的,但值得注意的是,在特定的讨论语境下,“数据”和“信息”两个概念可以互换,如个人信息和个人数据、政府信息和政府数据等表述互换一般不会使人产生误解。近年来我国有关部门在发布有关个人数据的相关规定和标准规范时,一直使用“个人信息”而非“个人数据”的称谓,例如价值密度是单位数据所产生的有价值的信息量。价值密度低是指大数据虽然规模庞大(价值巨大),但是有价值的信息所占比例较小。
最新的《信息安全技术一个人信息安全规范》(GB/T35273—2020)。从国内外对于这些件的界定来看,我国实际上并没有区分“个人数据”和“个人信息”。
数据的功能:在数字经济的发展历程中,数据起到了核心和关键作用,人们对数据功能的认识也由浅入深、由简单趋向复杂。总体来看,人们对数据功能的认识主要分为三个阶段:
第一阶段是数据资源阶段,数据是记录、反映现实世界的一种资源;第二阶段是数据资产阶段,数据不仅是一种资源,还是一种资产,是个人或企业资产的重要组成部分,是创造财富的基础;第三阶段是数据资本阶段,数据的资源和资产的特性得到进一步发挥,与价值进行结合,通过交易等各种流动方式,最终变为资本。
数据作为生产要素。在信息社会中,数据已经成为信息技术和网络空间赖以生存和发展、不可或缺的物质基础。在数字化环境中,所有要素只能以数据的形式外化。它和资本、劳动力、土地和能源等生产要素一样具有很高的价值,是一种新型的战略性社会资源,这意味着任何主体对数据的非法干预都可能构成对国家核心利益的损害。但是,数据与这些传统生产要素不同,它具有可再生、无污染、无限性的特征。可再生是指数据资源不是从大自然获得的,而是人类自己生产出来的,通过加工处理后的数据还可以成为新的数据资源;无污染是指数据在获得与使用的过程中不会污染环境;无限性是指数据在使用过程中不会变少,而是越用越多,这与传统资源越用越少的特征不同。
数据作为资产。随着数字经济的发展,人们发现数据不仅仅是资源,还具备资产的特质。所谓资产,是指由企业过去经营交易或各项事项形成的、被企业拥有或控制的、预期会给企业带来经济利益的资源。从资产的界定来看,它具有现实性、可控性和经济性三个基本特征。现实性是指资产必须是现实已经存在的,还未发生的事物不能称为资产;可控性是指企业要对资产有所有权或控制权;经济性是指资产预期能给企业带来经济效益。结合资产的特征,数据资产便是指企业在生产经营管理活动中形成的,可拥有或可控制其产生及应用全过程的、可量化的、预期能给企业带来经济效益的数据。实现数据可控制、可量化与可变现属性,体现数据价值的过程,就是数据资产化过程。但要注意数据并不等于数据资产,也就是说,并非所有的数据均有经济效益,除非同时满足可被计量、可被控制、可被变现的属性。当前,数据已经渗入各行各业,逐步成为企业不可或缺的战略资产,企业所掌握的数据规模、数据的鲜活程度,以及采集、分析、处理、挖掘数据的能力决定了企业的核心竞争力。
数据作为资本。资本是用于投资得到利润的本金或资产。在数据资产不断为企业获取大量经济效益的同时,数据已经成为一种资本,和金融资本一样,能够产生新的产品和服务。但是,与实物资本不同,数据资本也有自身的特性,例如,数据资本具有不可替代性,即实物资本是可以替换的,人们可以用一袋米替换另一袋米,而数据资本则不行,因为不同数据包含着不同的信息,其包含的价值也是不同的。数据资本化的过程,就是将数据资产的价值和使用价值折算成股份或出资比例,通过数据交易和数据流动变为资本的过程。也就是说,数据作为资本的价值要在数据交易和流通中才能得到充分体现。
在数据变成资产前数据必须进行确权,只有确定了那些数据谁拥有产权,谁拥有加工使用权,谁拥有经营销售权,这样是数据交易的基础和前提。
