大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹

大数据是IT行业术语,简意是指无法用常规软件管理和处理的数据集合 。它具体由云计算、分布式处理技术、存储和感知技术四部分组成 , 並贯穿从数据采集、处理、存储形成的整个过程 。
大数据要实现全方位、全天候对人的轨迹跟踪,必须和互联网及信息采集设备结合才能充分发挥作用 。
【大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹】

大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹

一、大数据实现对人轨迹的跟踪从基于互联网的信息数据采集开始 。
大数据主要功能是信息数据的存储、计算和分析处理 , 但必须从信息数据的采集开始,否则成了“无米之炊” 。並且还要依赖先进完善的网络系统及信息数据采集的手段和设备才能得以完成 。
上海浦东有位李阿姨、一次有急事在斑马线闯红灯走过马路 。一星期后、附有现场境况和其照像的20元罚款单寄到了家中,李阿姨纳闷了、怎么拍照和找到我的?
其实,这就是大数据和互联网及信息采集设备共同作用形成的 。先由大数据的“眼睛”一监控系统采用高分辨镜头自动录像后上传到数据中心,云计算后得出她是“谁”的结论,不会有丝毫差错 。
大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹

那是通过怎样过程实现的呢?信息采集设备包含前端音视频采集、传输,后端存储、控制及显示五部分设施 。而每个人的相貌特征、身高性别、形态样式和步伐简距,甚至包括脸型特点、五官距离尺寸、衣着颜色神态,都有各自特有的衍生光点而形成特色 。
信息采集设备把这些要素上传到数据处理中心,依据存储在内的其它各类信息进行云计算,即可得出你的年龄和姓名、性别和住址等详细情况的匹配分析结果 。计算机就可以给你开罚单了 。
大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹

二、大数据实现对人的轨迹跟踪、互联网络的完善和信息联通是必须条件 。
基于时间先后顺序和环境空间范围内人的轨迹是随机和运动的,大数据分布式处理技术形成了网格化管理模式 。即可根据人运动轨迹确定其所在区域和时间,进行连续不间断地跟踪、记录相对人情况 , 并用云计算方法掌握运动的时间和所在位置 。
如有1人从浦东国际机场入境后住宿到预定酒店,然后外出就餐和商场购物、第二天打的到火车站乘高铁,辗转某处后到目的地 。一路上其运动轨迹、行为举止 , 都由不同区域的信息采集设备根据需要被记录 。包括乘坐车辆类别和形状、车牌颜色号码、路径时间都可以需要时调度到显示屏上分析处理 。这都是基于互联网络的完善和信息联通 。
大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹

三、大数据实现跟踪人的轨迹是分布式处理技术和云计算的结果 。
大数据分布式处理技术帮助建立了信息数据众享管理机制,使存储的信息能够共用 。相对人在运动中产生的轨迹都会有相应的信息采集设备、摄取后用网络传输到数据中心,需要的部门可全网调取使用 , 实现跟踪人的轨迹 。
有人说:“互联网是有记忆的”、事实确是如此,但它是通过大数据来完成 。人的相关行为轨迹 , 根据需要都会被记录在数据中心进行存储,要用时可调取进行分析 。
大数据查询个人轨迹能有多精确 怎样避免大数据追踪个人轨迹

有了大数据和网络及信息采集设备融合使用 , 相对人行为的时空概念被引伸到可知和可寻找的范围内 , 查觉和跟踪一个人的轨迹並非是难事,不依靠手机定位也有办法发现和寻找相对人了 。
仅以手机为例(PC隐私问题很早的事情了) , 各种嵌在应用程序内的SDK、监测工具、第三方输入法都在随时收集设备上的信息,并利用各自的算法(其实都差不多)给这个设备打标记,比如是男是女、年龄区间、收入高低、受教育程度…等等 。同一家互联网公司旗下的不同平台也都在整合各类数据,比如抖音和今日头条背后是一套数据、饿了么或优酷中的行为会影响淘宝推荐(据说阿里巴巴还要和微博(持有股份)打通数据,那可了不得了) 。
并不一定自己在设备上有动作,也可以是周围的人 。推荐算法的逻辑宏观上讲就是1)大家都喜欢的,你喜欢的概率大:推荐全网点击量大的 , 累计点击量或者是最近几小时特火的,不管是啥;2)你周围人喜欢的,你喜欢的概率大:你通讯录里的人、跟你一起上网的人(同一个wifi,即请求来自同样的公网ip地址 , 互联网平台立刻能把你的设备和你旁边人的设备联系到一起)、甚至是一个单元楼的人(ip地址比较少的低级别城市很多家共用同样的ip,以后ipv6了就会好很多)的行为会影响你看到的广告 。3)跟你类型相似的人喜欢的,你喜欢的概率大:比如过去24小时内带有25至30岁高收入女性标记的设备干了啥,接下来同样标记(一般也会加上地域限制)的设备使用者就更大几率看到同样的推荐 。
从法律上讲,贩卖公民信息是比较严重的事情,但往往仅限于贩卖手机号这种简单粗暴的行为,因为会产生骚扰 。但互联网和大数据采集的发展太快了 , 现在已经不需要知道手机号(当然知道更好,毕竟是唯一识别码)就可以完成所谓的“精准营销”了 。因此虽然我们多少会感到困惑,甚至觉得有点过分或骚扰 , 但严格来说人家都是合法的 。老实说这一块儿监管是有些滞后(哪个快速发展的行业都是如此),而且国家重点发展大数据呢短期内估计也不会咋样,外加实话实说目前各家的推荐算法只能说还凑活,并不能真的推给你你想要的,所以只能忍着喽…
最后说一点 , 就是运营商数据的应用(已经商业化往外卖了),会产生更严重的僭越 , 这个话题太大,不展开说了 。需要指出的是,在运营商数据被大量利用之时 , 互联网平台使用https加密传输应变为最起码的责任 。半年前的拼多多app是http传输(现在已经https了),用户本人的电话、家庭住址、花了多少钱买的什么东西,都能被第三方公司轻松获得… 。现在2019年1月底,饿了么把“百度外卖”app改成“饿了么星选”之后,仍然也是http传输 , 用户的电话、各个送餐地址(无论工作还是家庭还是帮朋友订的外卖 , 只要是之前用过的都看得到,可怕吧)也都能被第三方数据公司轻易获取,后果…大家自行脑补吧) 。在数据大潮挟裹之下,互联网用户无能为力,平台还是应该承担基本的责任 。目前能做的也仅有如此了 。

经验总结扩展阅读