导读:当前大数据的应用及其发展方兴未艾,未来前景令人期待。大数据在抗疫过程中的应用,既有让人眼前一亮甚至是叹为观止的积极效应,也存在着不容忽视的问题。
当前大数据的应用及其发展方兴未艾,未来前景令人期待。大数据在抗疫过程中的应用,既有让人眼前一亮甚至是叹为观止的积极效应,也存在着不容忽视的问题。
首先,数据资源质量不高。长期以来,很多政府部门都存在底数不明和基数不清等问题,政府管理的信息系统数据不全,疫情期间依靠人工方式来获取数据,比如社区工作人员通过手工填表或电话访问等方式来开展工作,不同政府部门用不同的途径以及格式(表格)采集数据,数据加工的过程缺乏严格的质量控制机制,导致许多数据质量较低,增加了数据清洗、集成和规约的难度,也降低了数据分析和数据挖掘的价值。
其次,信息孤岛问题突出。大数据的关键是“大”,疫情防控涉及方方面面,必须综合运用多个政府部门的基础数据库,具体如卫健、交通、公安和民政等系统,还要与铁路、民航和电信以及大数据企业广泛合作,但由于信息安全、部门利益和信息成本等原因,政府部门以及企业之间的信息壁垒依然存在,不同数据维度不一致,数据接口不一,很难实现共享和互通,跨地区、跨层级和跨部门的数据流转难以实现,严重抑制了大数据的效用。
再次,数据运算存在误差。数据是算法的基础。大数据抗疫的精准性源自于数据的全面性和有效性。当数据缺损或者没有数据时,哪怕算法和模型再好,也不可能得到有意义的结果,比如基于大数据的健康码是抗疫的重要利器,但多数省份的健康码相互不承认,很多从未去过湖北的人的健康码却识别出近14天有湖北出行记录,给抗疫工作带来了巨大的尴尬。
最后,个人信息安全隐忧。为了摸排人员流动等方面的情况,各级各地政府部门都上线了与疫情相关的大数据产品,广泛搜集社会民众的个人信息,包括身份证号、个人住所、健康状况以及近期活动等,但大量的信息通过杂乱的途径搜集起来,也形成了个人信息被窃取和泄露等方面的隐患,比如有湖北旅居史人群受到匿名辱骂和歧视,网上售卖疫情期间的个人信息等。
另外,大数据虽然功能强大,具有很好的预测能力,有时候看上去很精准,但这些终归也只是概率估计和相关性分析,并且主要是对总体情况而言,很容易出现错误或偏差。但对于个别情况或特殊问题而言,比如对社区居民的摸排,最终还是要人工作业去解决问题,而不可能只是停留于概率层面,也不可能通过不见面的网络或数据就能解决问题。
上一篇文章:大数据技术在抗疫中的应用效能
下一篇文章:推进安防产业推进大数据技术发展的思考
中北国泰建设集团有限公司
地址:北京市丰台区总部基地2区10号楼10层
电话:86-010-63727355