
数字身份的相关形态
个人信息
与数字身份密切相关的另一概念是个人信息(Personal Informa-tion)。《中华人民共和国民法典》(简称《民法典》)第一千零三十四条规定了个人信息的定义:
个人信息是以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人的各种信息,包括自然人的姓名、出生日期、身份证件号码、生物识别信息、住址、电话号码、电子邮箱、健康信息、行踪信息等。
《中华人民共和国网络安全法》(简称《网络安全法》)和《中华人民共和国个人信息保护法》(简称《个人信息保护法》)中的定义与此基本相同。国家标准《信息安全技术 个人信息安全规范》(简称《个人信息安全规范》)(GB/T 35273—2020)中还详细列举了个人信息的范围和类型,其中还包括网络身份标识及信息、个人上网记录、个人常用设备等信息。
数字身份是个人识别信息。为了判定某项信息是否属于个人信息,《信息安全技术 个人信息安全规范》给出了两个判定条件:一是单独识别特定自然人身份的信息,如姓名、身份证件号码、个人生物识别信息、住址、联系方式、账号密码等;二是与其他信息结合识别特定自然人的身份信息,如出生日期、医疗记录、财产信息、征信信息、行踪轨迹、住宿信息、健康生理信息。
欧盟将个人信息表述为个人数据(Personal Data)。欧盟的《通用数据保护条例》(简称GDPR)就是一部个人数据保护法,其中对个人数据的定义如下。
个人数据指的是任何与已识别或可识别的自然人(数据主体)相关的信息;可识别的自然人是能被直接或间接识别的个体,特别是通过诸如姓名、身份证件号码、位置数据、网上标识,或者与该自然人的身体、生理、遗传、心理、经济、文化或社会身份有关的一个或多个因素。
欧盟对个人数据的定义范围很广,既有用户的识别数据,也有用户关联数据,无论是在线还是离线,所有数据都在条例的保护之下。数据是否属于个人数据还应基于语境来判断,比如住房的价格,作为统计数据中的房价不属于个人数据,但在财产税的申报表中,这个房价就是个人数据了。
通常数据和信息在含义上有一定差别,数据一般指未处理的原始数据,信息则是数据经过分析处理的结果。但欧盟GDPR中的个人数据与我国《个人信息保护法》及《个人信息安全规范》等所称的个人信息,无论是概念还是界定标准,几乎都是完全一致的。在当前语境下,这两个词没有本质区别,如果没有特殊说明,本书不对这两个词进行区分。
隐私是个人信息最重要的部分。我国《民法典》第一千零三十二条第二款将“隐私”定义为:
自然人的私人生活安宁和不愿为他人知晓的私密空间、私密活动、私密信息。
个人隐私与个人隐私权相联系,属于人格权之一。个人隐私保护就是通过保护个人私生活秘密,来保障个人私密空间的安宁,不受他人非法干扰;保护个人私密信息,使其不受非法收集、刺探和公开等。
个人隐私信息通常都是个人敏感信息。我国《个人信息保护法》《个人信息安全规范》都给出了个人敏感信息的定义、判定方式(如泄露、非法提供或滥用),以及可能造成的后果(导致个人名誉、身心健康受到损害或歧视性待遇等)。敏感信息的类型主要包括个人生物识别信息、宗教信仰、特定身份、金融账户、医疗健康、行踪轨迹、性取向、婚史、未公开的违法犯罪记录、通信记录和内容、通讯录、好友列表、群组列表、网页浏览记录、住宿信息、精准定位信息等。
GDPR依据敏感性对个人数据进行了分类,第一类包括种族、民族、政治观点、宗教信仰、工会成员资格;第二类是生物特征类数据,如基因数据、生物特征数据;第三类涉及健康、性生活、性取向的数据, GDPR将其定义为特殊类型个人数据,其处理要求更为严格。
隐私与信息安全密切相关,信息安全主要是对数据资源的防护,而隐私主要对用户身份和个人数据的保护。随着个人数据的价值越来越大,隐私保护的紧迫性和关注度已经超过了传统的信息安全。
数字身份与个人信息
人是数字空间活动的主体,每个人都应该拥有一个属于自己且无法被篡改的数字标识。对于个人来说,数字身份具有双重属性,一是个人身份标识,用于身份认证和授权;二是个人信息数据库,既包括个人的基本情况,还包括个人在网上的行为产生的数字记录,以及与个人有关的其他数据,比如其所驾驶的智能汽车的车况、其所在地区的天气情况等。可见,个人信息与人的数字身份就像一枚硬币的两个面,这两个概念既有区别,又相互依存。个人信息可为数字身份提供身份认证所需要的相关属性,数字身份则通过身份认证和授权保障个人信息的安全。其主要区别如下。
第一,两者的范围不同。数字身份的主体包括人、组织机构及设备,还有系统、服务、应用等,而个人信息的主体只能是自然人。对于个人来说,数字身份和个人信息的属性内容大部分重叠,相互补充。数字身份侧重强调个人的当前属性,而个人信息则包含个人历史信息,由于时过境迁,这些个人信息在数字身份系统中应用不多。如一个人升职后,其身份属性就变为他当前的新职务,但个人信息则包括他担任过的职务。还有电商订单记录、聊天记录等也都属于历史数据,这些数据对于个人来说意义不大,但对于互联网和大数据平台来说,就是个人大数据,可以提炼出反映个人性格特性和习惯爱好的数字画像,具有很高的商业价值。
第二,两者的使用目的不同。数字身份常用于网络与信息安全防护方面,比如用户身份辨识、认证、授权或访问管理等,以保护包括个人信息在内的各类信息资源的安全;个人信息的主要目的往往是利用大数据分析技术对个人数据进行分析、处理,获得个人数字画像,并将其应用到商业服务、政务服务、社会治理等领域,以释放其潜在的价值。
第三,存在的形态不完全相同。数字身份通常在数字或网络空间存在,基本都是完全数字化的形态;而个人信息尽管也多在网络上产生、处理和使用,但也有很多个人信息存在于物理空间,比如私人信件、日记等。
数字脚印
当你在使用计算机、手机或其他智能终端设备访问互联网时,就不可避免地要留下很多数据痕迹。比如你在网上注册账户,需要上传各种个人身份信息,甚至人脸、指纹等生物特征信息;你浏览网页新闻、在网络社区发表的观点评论;在社交平台上的聊天记录,发布的文字、图片、视频等,以及点赞、转发等互动交流;你使用网上约车服务,系统会记录你的行动轨迹;你在购物网站的选购浏览、交易记录;可穿戴设备记录下你身体的各种指标数据等,这些都是你在网络空间留下的“数字脚印”。
数字脚印是个人信息的一种形态,按照产生方式可分为两种:一种是通过人与网络系统或通信设施的交互产生的,比如用户位置轨迹、通话数量及时长等;另一种是用户主动发布帖子、评论,或上传到网络空间的图片和视频等,其中地理标识照片往往包含何时何地拍摄、描述性标签,还有拍摄者的个性信息等。
互联网平台根据客户数字脚印可以绘制出用户数字画像,从而可以识别出用户的消费偏好、性格需求、经济状况等价值特征,进而推送相关的内容或服务来满足用户需求。数字营销方式针对性强、精准度高,效率和效益远超传统广告。剑桥大学和斯坦福大学的研究表明,基于足够的脸书(Facebook)点赞量,数据分析结果可以比你的朋友、家人甚至伴侣更好地判断你的性格特征。
根据数字脚印,可以推断出三项有价值的客户特征,分别如下。
①经济条件:从客户使用的电子设备和邮箱(包括手机设备类型、操作系统类型以及邮件服务商)可以了解其经济条件,比如使用新款苹果手机的客户,其经济状况往往较好。
②用户性格:通过以何种途径进入购物网站以及何时购买商品可以判断客户的性格。例如,来自比价网站的客户的违约率几乎是被搜索引擎广告引流过来的客户违约率的一半。
③声誉:包括是否进行“请勿追踪”设置、邮件是否包含姓或名、邮件是否包含数字、输入邮件地址或邮寄地址时是否全用小写、输入邮件地址时是否出现拼写错误。比如电子邮件地址中包含自己名字的客户违约的可能性低30%。
数字脚印还有更多应用。征信机构可以将其作为信用评分的依据之一,金融机构可以利用其发现哪些因素与客户违约有关。在印度,数字脚印被用于推进普惠金融,比如金融机构通过客户资金流和税务发票等信息综合判断客户的偿还能力,这样就能以合理利率为中小企业主或个人提供优惠贷款。
数字脚印还有一个特性,那就是持久性。在互联网上,每个人的数据脚印都不会随意消失,不同网站平台会共享、转载个人数字脚印,使其成为一种新型遗产,即数字遗产。区块链技术的出现更是标榜数据的不可篡改性,数字脚印更难以被删除。此外,互联网平台的数字脚印还可能会被黑客、黑灰产业的不法分子窃取利用,据此发现用户的个人弱点,通过欺诈手段对用户造成伤害。从这种角度看,数字脚印像是个人数据的“尾气”或“废气”。
用户画像
中文“用户画像”是一个承载多种含义的术语。交互设计之父Alan Cooper提出的User Persona是最早的用户画像,主要针对产品设计和营销人员,帮助他们从用户群体中归纳出典型用户。这更像一个需求分析工具。
本书使用的用户画像为另一概念User Profile,也称数字画像,这是一个精准大数据分析工具。User Profile是一种标签化的用户表示模型,首先通过归纳整合用户的各种数据,按照商业或其他需求,利用数据挖掘等技术,综合分析用户的各种情况,如个人偏好、行踪轨迹、访问网站或社交记录、工作绩效、生活习惯、健康或医疗记录、金融信贷记录、购物消费习惯等标识特征,最后构建出标签化的用户特征模型。给用户画像一般是打标签(Tag),而标签实际上代表用户某一维度的特征。
用户画像需要获得用户在多个网站或平台的数据记录,这个过程需要获得用户的全局性的唯一身份标识,比如身份证号,还可以通过手机号、用户账号等进行补充,以便获得更加完整的特征数据。一般来说,数据来源越多,用户画像就越精准,价值越高。
用户画像过程中最基础也是最核心的工作是构建标签体系,后续的建模、数据仓库搭建等都基于这个标签体系。这些标签都是人为规定的,不同行业、不同领域,甚至不同企业的标签系统都可能不一样,比如有电商类标签体系、金融类标签体系等。
用户画像的应用场景很多,比如通过挖掘用户兴趣偏好、人口统计学特征,可提升市场营销精准度、推荐匹配度和运营的精细化程度,为用户提供个性化产品或服务,优化用户体验。用户画像适用于潜在用户挖掘、新用户导引、老用户维系以及流失用户挽回等环节。
数字分身(Avatar)
数字身份是识别个人并使个人与数字空间中的其他人区别开来的属性特征,这类似我们在现实世界中的身份证;同样,在数字空间也有一个数字化的拟态自我,这就是数字分身(Avatar)。
数字分身最早出现在科幻电影和第一视角类游戏中。比如在电影《阿凡达》中,人们可以控制自己的数字分身,在虚拟空间从事各种活动。与用标签刻画内在特质的用户画像不同的是,数字分身重点强调用户的外在可视形象。在社交网站中,人们使用头像、皮肤或个性签名作为展示自我的方式。数字分身可以是2D卡通头像,还可以是与本人高度相似的数字模型,甚至可以只有上半身,比如脸书推出的《地平线》游戏。
数字分身与近年来兴起的元宇宙概念密切相关。元宇宙是新一代互联网的形态,主要特征是有着3D的界面环境,人们可以使用3D头显获得高度沉浸感和现场感,从而可在其中进行生活、工作和社交,其中的每个人都是以数字分身呈现,以便与其他人进行交流和互动。