新普京解密游走于法律边缘的爬虫技术

新普京 1

T+- (原标题:解密游走于法律边缘的爬虫技术)
游走于法律边缘的爬虫业务中国新闻周刊记者/赵一苇发于2019.10.21总第920期《中国新闻周刊》一场席卷大数据风控行业的风暴仍在继续。从9月下旬开始,多个业内闭门交流会紧急召开,每个会场都摆出严防死守的架势。“参会者中不乏近期被查或有关联的大数据公司高管。”一位接近会议的业内人士向《中国新闻周刊》透露,这些闭门会严格保密参会名单,拒绝外部报名,会场门口都会严格逐一核验参会者身份,尤其严禁媒体进入,“大家都是来讨论以后怎么办,能不能活下去都是个问题。”这是一场针对大数据服务商的强监管风暴。自9月初起,多家杭州、上海的大数据风控公司被调查,业内知名的集奥聚合、新颜科技、公信宝等多家公司的核心高管被警方带走调查,连一些与这类数据公司有过交易经历的公司高管也被警方带走协助调查,其中包括中国电信旗下征信机构天翼征信的多位核心高管。但在消息传出后,天翼征信和新颜科技方面仍向《中国新闻周刊》表示,“公司业务一切正常。”业内已风声鹤唳,尤其以惯用网络爬虫技术爬取并违规使用数据的公司最为恐慌。所谓网络爬虫,即一种按照一定规则,自动抓取互联网信息的程序。在大数据风控行业中,以网络爬虫获取信息数据的做法盛行,而违规使用、买卖爬虫得来的数据则是导致数据泄露、隐私泄露等一系列问题的根源。“爬虫技术本身是中性的,关键在于是否合规使用爬虫数据。”中关村大数据联盟副秘书长陈新河在接受《中国新闻周刊》采访时表示,如果通过爬虫抓取网络公开信息或授权信息,并不违规;但如果抓取的是未公开、未授权的个人敏感信息,且违规留存、使用、买卖这些隐私数据,就属于违规行为。“真正合规的公司数据来源都是有官方授权的,能获得这类授权的公司少之又少。”一位长期与大数据公司打交道的甲方公司高管告诉《中国新闻周刊》,大数据风控行业门槛低,业内鱼龙混杂,且监管难度大,“行业混沌,监管层只能先一刀切”。大数据公司被查的蝴蝶效应迅速传导至信贷市场。最近一个月里,多家中小银行和金融机构纷纷收紧信贷产品审批,多家网贷公司和贷款超市平台大面积下架借贷产品。“许多中小银行和金融机构的风控模型对第三方数据有较大依赖性,自身风控体系不完善,依赖的外部数据被切断,风控势必会受到影响。”一家与持牌金融机构有多年合作经验的第三方风控公司高管告诉《中国新闻周刊》。很快,监管层表明了督促银行加强自主风控的态度。10月12日,北京银保监局印发《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》,要求规范辖内银行与金融科技公司合作类业务及互联网保险业务,促进银行保险机构加强风险管控和合规管理,明确强调要严格落实自主风控原则。“监管层对数据公司的整顿酝酿已久,但完备的数据安全法还暂时不会出台。”一位接近监管层的人士向《中国新闻周刊》透露,“如何界定个人数据的法律性质,仍然是一个需要探讨的问题。”暂停爬虫业务这一轮强监管从深圳、杭州、上海等地开始,已经迅速席卷了整个大数据风控行业。整顿力度之大,令业内和相关合作方人人自危。“现在行业内基本暂停了爬虫业务,很多之前做爬虫的也都在清理数据库,就怕被查。”一位大数据金融业内人士告诉《中国新闻周刊》,不仅是互联网金融公司,连与大数据公司只有过零星合作的招聘公司、风控公司最近也纷纷切断了合作,“数据公司被查,相关行业都会受到波及。”在大数据行业中盛行的爬虫技术,主要分为公开爬虫和授权爬虫两类。前者只能爬取机构或网站公开发布的信息数据,如工商信息等;而后者则需要取得用户的个人授权,以爬取个人通讯录、邮箱、网银、电商平台等个人隐私数据。根据全国信息安全标准化技术委员会于今年6月发布的《个人信息安全规范》征求意见稿,个人信息控制者在收集个人敏感信息前,应征得个人信息主体的明示同意,并应确保个人信息主体的明示同意是其在完全知情的基础上自主给出的、具体的、清晰明确的意愿表示。“所有数据授权都需要明显明确地告知消费者,授权获取数据是关键。”深圳中兴飞贷金融科技公司副总裁孟庆丰在接受《中国新闻周刊》采访时表示,“不可否认的是,数据行业内确实存在许多不合规的做法,尤其是未经授权的爬取数据。”“这次事件之前,正常情况下,即使是已获得用户授权的爬虫,在爬取数据并合规使用后,数据就消失了。”中关村大数据联盟副秘书长陈新河向《中国新闻周刊》举了个例子,“譬如你申请A银行的一项贷款产品,就需要授权A银行去查询获取你的社保、公积金、航班出行等数据,银行可能通过一个中间数据服务商去授权爬虫,爬虫得到的信息提供给A银行,在双方约定的规则上,这些数据的使用就到此为止,不得留存或卖给第三方”。这次事件之后,以北京银保监局2019年10月12日公布的《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》为代表,其明确规定“严禁与以‘大数据’为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作。”中间服务商的合规评估、认证需要时间,为降低风险,A银行将多采用“断代购直”,采用直连数据源的模式,中间数据服务商的模式将大大受到限制。值得注意的是,正是一些大数据服务商获取了未经授权的数据或授权后擅自留存的数据,才滋生出游走于灰色地带的数据生意。有互联网金融公司人士向《中国新闻周刊》提供的一份数据服务商报价单显示,常规数据服务一般分为身份验证类、联系人验证类、位置验证类、基础属性标签类等,既有身份证号、手机号、姓名等信息,也含有近三个月联系人活跃度排名、通讯录名单、常用位置信息等隐私数据。所有服务均按次收费,单次有效查询的价格在0.38元~0.98元不等。“在数据行业,每条信息都是明码标价,如果包年还有额外折扣。业内人士介绍,许多数据公司既提供信息查询服务,宣称“毫秒级响应”,也支持数据输出打包买卖。除了通讯类个人信息数据,在互联网金融公司日常接触的各数据公司报价单中,关于个人社保、公积金、司法信息、网银支付宝账号密码、淘宝京东等电商平台交易记录、社交平台信息等重要隐私数据,也赫然在列。“许多数据公司对数据来源避而不谈,只强调数据本身的价值。”上述互联网金融公司人士向《中国新闻周刊》表示,“很难说他们是通过什么渠道获取这些数据的,也很难去验证数据来源。”2017年6月1日开始施行的《网络安全法》中已明确规定,网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意;网络运营者不得收集与其提供的服务无关的个人信息;未经被收集者同意,不得向他人提供个人信息。同时,《个人信息安全规范》中也明确提出,个人信息控制者在共享、转让个人敏感信息前,应向个人信息主体告知涉及的个人敏感信息类型、数据接收方的身份和数据安全能力,并事先征得个人信息主体的明示同意。“未经授权的爬取、使用、贩卖数据相当于偷窃。”深圳中兴飞贷金融科技公司副总裁孟庆丰向《中国新闻周刊》直言,“一些数据公司既没有获得授权,又擅自利用爬虫技术去违规采取外部数据,这就是不被允许、不合规的。”“爬虫技术好比是一把刀,刀本身没有错,关键看用刀的人是谁,用刀的目的是什么,不能因为一个罪犯用菜刀杀了人,便判定所有菜刀都是杀人工具而被全部禁止使用。”陈新河在一个涵盖目前主流金融科技公司的362人“01数据爬虫危机讨论群”抛出这个观点得到大家的一致认可。陈新河对《中国新闻周刊》强调,“这次所谓的“爬虫危机”,罪名就有问题,爬虫与危机没有直接的逻辑关系,真正的问题不在于爬虫技术,而在于数据的合规获取和合规使用。”在10月12日举行的2019中国普惠金融国际论坛上,Visa大中华区首席风险官杨景香提出:“数据即是问题也是解决方案。不需要存储的数据一定不要存储,敏感数据一定不要存储。”大数据风控之兴回溯大数据风控行业的兴起路径,不难发现其与互联网金融的爆发关系密切,两个行业的发展也亦步亦趋。自2013年起,各种消费金融机构、互联网贷款平台迅速兴起,依靠互联网大数据的风控与获客体系,迅速成为消费金融市场的主力军,同时倒逼传统银行加快互联网转型。在抢夺市场的战争中,金融机构纷纷加快脚步,线上获客与风控的需求暴增。“中小型银行和各类金融机构、网贷公司都是大数据风控的需求方。”一位资深城商行高管告诉《中国新闻周刊》,大银行一般拥有坚实的数据基础和较强的数据下沉能力,而对于基础和能力都较薄弱的中小银行和网贷公司来说,第三方数据服务则可以作为提升风控能力、提高信贷效率的重要帮手,“有的机构会从第三方购买数据来完善自己的风控模型,有的小机构会直接购买第三方的数据模型或评估结果。”需求刺激之下,大数据风控行业应运而生。根据亿欧智库2018年11月发布的《2018中国智能风控研究报告》(下称《报告》)显示,截至当时,金融风控企业已经达到573家,其中超过六成企业成立于2014~2016年。行业的迅速崛起离不开风投的助推。根据上述《报告》数据,在当时的573家金融风控企业中,有192家企业获得投资,投资金额超过1000亿元,其中三成企业获得三次及以上的投资。野蛮生长的浪潮中,依靠爬虫技术违规爬取和使用数据的公司迅速壮大,凭借丰富的数据来源和极低的操作成本,跻身行业前列,市场份额甚至大大超过合规数据公司。“真正合规的公司数据来源都是有官方授权的,有严格的官方指定,本身数量占比小,市场份额也占比小。”一位长期与大数据公司打交道的甲方公司高管向《中国新闻周刊》透露,“那些做非授权数据的公司,一般成本和价格都较低,但核心数据一旦出问题就非常麻烦。”鉴于大数据风控公司良莠不齐的现状,金融机构与大数据公司实际业务合作往往采用“一对多”的模式,以期获得尽可能丰富的数据源,尽可能加强大数据风控的可靠性。“大部分合作的金融机构都会同时和十几家第三方数据风控公司有业务往来,会购买多家公司的数据产品来交叉验证,以求更有保障的风控。”一位互联网金融公司人士向《中国新闻周刊》表示,“越大的金融机构愿意购买更多数据源来完善自己的风控模型,有些自身就不规范的小型网贷公司甚至只会直接买评估结果。”“有实力的金融机构会强调大数据的全流程应用,贯穿获客、风控、反欺诈、催收等多个环节。”苏宁金融研究院院长助理薛洪言在接受《中国新闻周刊》采访时谈到,对大机构而言,有些环节是需要买一些原始的数据来完善已有的模型,补齐用户画像,起到辅助风控作用;但对小公司而言,奉行“拿来主义”的成本更低,更倾向于直接采用第三方的解决方案,比如黑名单、智能营销策略等。随着监管层对大数据行业的监管收紧,既无官方授权,也无完善用户授权的大数据公司面临生存危机,这类大数据公司大多已开始尝试转型。有业内人士向《中国新闻周刊》透露,目前业内以未授权爬虫的数据源为主要业务的公司基本已经停摆,都在尽可能地做合规业务。相关合作方也都在清查合作数据公司的数据源合规性,对于数据源授权语焉不详的都会主动切断联系。“能获取的数据源变少后,公司的风控模型一定会变。”深圳中兴飞贷金融科技公司副总裁孟庆丰告诉《中国新闻周刊》,“任何一个风控模型都是基于一定的数据源而建立,且需要一定时间来进行完善和验证效果,数据源的更改尤其是变少,会显著影响模型的精准度。”苏宁金融研究院院长助理薛洪言认为,这一轮对大数据公司的整顿无疑是一次行业洗牌。“不合规公司的客户必然流失,实力不足的公司也会因数据源的减少引起模型预期准确率的下降,同样面临客户流失的困境。”“强监管的效果一直持续到明年,大数据行业一定会有一次彻底的洗牌,该退场的不合规公司都会退场。”孟庆丰直言,“随着监管层对数据安全的持续发力,以后数据行业内能活下来的必定只有获取了官方授权的合规公司。”银行堵漏洞10月上旬,多位业内人士向《中国新闻周刊》确认,最近央行已将《个人金融信息(数据)保护试行办法(初稿)》下发到各家银行,目前正在征求意见中。根据今年4月发布的《中国人民银行2019年规章制定工作计划》,该《办法》是中国金融领域落实《网络安全法》确立的网络信息安全和网络运行安全两大制度的最高位阶部门规章。10月12日,北京银保监局印发《关于规范银行与金融科技公司合作类业务及互联网保险业务的通知》(以下简称《规范通知》),明确提出银行需要加强合作机构管理,严禁与以“大数据”为名窃取、滥用、非法买卖或泄露客户信息的企业开展合作。实际上,自9月初开始的大数据公司被查风波后,已有多家中小银行主动切断了与涉嫌不合规的大数据公司的合作,但随之而来的是银行信贷审批的收紧。“现在中小银行和金融机构都不太敢去买第三方的数据产品了,开始强调用自己的风控部门获取用户授权后爬,业务规模和审批效率都受到了很大影响。”一家与持牌金融机构有多年合作经验的第三方风控公司高管告诉《中国新闻周刊》。“不可否认,这几年城商行、农商行的迅速发展,离不开线上大数据公司的帮助。”前述高管表示,“许多中小银行和金融机构的风控模型对第三方数据有较大依赖性,自身风控体系不完善,依赖的外部数据被切断,风控势必会受到影响”。值得明确的是,一些大数据风控公司的确对中小银行完善风控体系起到了一定积极作用。以最近被调查的知名数据公司同盾科技为例,其官网上展示的客户案例仅有一则与渤海银行的合作,称为渤海银行量身定制了覆盖业务全流程的风控体系,其信用评分模型的KS值达到40%,比行业平均水平提升10%。在10月11日召开的中国普惠金融国际论坛上,方付通董事长兼CEO孙宏宇提出,大数据不决定一切。在缺乏线上数据的时候,可以通过线下数据补充,再结合线上的科技手段验证,从而提高中小银行客户数据的完整度。“值得肯定的是,近年来大数据公司对金融机构提高风控能力、提升效率确实起到了积极作用。”浙江泰隆银行首席经济学家郑勇军在接受《中国新闻周刊》采访时表示,大数据等金融科技广泛应用于小微金融、普惠金融领域,有助于解决小微客户信用数据不完整的问题,“对于中小金融机构而言,大数据的应用多体现在风控环节”。郑勇军认为,大数据的应用一般可贯穿金融机构贷前、贷中、贷后三个环节。其中,贷前环节包括审核、反欺诈、征信等信息验证,贷中环节可以起到辅助信用评分、风险定价、加快审批等作用,贷后环节可以起到监控资金去向、管理存量客户等效果。“需要注意的是,如今主流的风控模式仍然需要线上加线下共同组成,不能完全单纯依靠线上的大数据风控模型。”郑勇军强调,“在现阶段,线下审查仍然具有必要性。”在方付通董事长兼CEO孙宏宇看来,在很长一段时间内,线上、线下相结合仍然是主流风控模式。“所谓纯大数据风控,中国可能还需要时间,可能得百行征信再丰满以后才能实现。”对此,监管层的态度与业界一致。北京银保监局印发的《规范通知》中也明确提出,银行要严格落实自主风控原则,不得将贷款“三查”、风险控制等核心业务环节外包给合作机构,不得仅根据合作机构提供的数据或信用评分直接作出授信决策。个人金融信息隐忧早在这一轮大数据行业清洗前,监管层在2017年5月、2018年11月,已针对电信诈骗、爬虫导致的个人信息泄露有过两轮整治。其间,《网络安全法》在2016年11月公布,并于2017年6月1日正式实施,并查处了多个非法获取数据的案例。2017年,曾号称“数据第一股”的北京数据堂被警方调查,也成了大数据爬虫公司中第一个入刑案例。这家在2014年就挂牌新三板的科技公司,经查涉嫌利用网络爬虫技术违规获取、倒卖个人信息数据,在8个月时间内日均传输公民个人信息1.3亿多条,其中包括重要隐私数据。2018年8月,山东省费县人民法院一审判处数据堂首席运营官柴银辉、营销产品部副总裁胡晓敏有期徒刑三年。中关村大数据联盟副秘书长陈新河向《中国新闻周刊》直言,在监管进一步收紧前,国内游走于灰色地带的数据买卖体量不可小觑,“最常见的有买房后被装修公司营销、买车后被保险公司营销等。随着大数据的覆盖越来越广、应用场景越来越多,数据合规使用和个人数据隐私保护更加迫在眉睫。今年以来,关于加强个人金融信息立法保护的监管信号密集释放,有关部门正在抓紧推进数据保护方面的规章制度、标准等的制定工作。截至10月,国家互联网信息办公室已经会同各行业主管部门研究起草了《数据安全管理办法(征求意见稿)》《网络安全审查办法(征求意见稿)》《个人信息出境安全评估办法(征求意见稿)》《儿童个人信息网络保护规定(征求意见稿)》《App违法违规收集使用个人信息行为认定方法(征求意见稿)》,并面向社会公开征求意见。此外,工业和信息化部也会同有关部门起草了规范性文件《网络安全漏洞管理规定(征求意见稿)》,正在向社会公开征求意见。值得一提的是,央行于10月下发到各银行的《个人金融信息(数据)保护试行办法(初稿)》(以下简称《办法》)正是近几年业界一直呼吁出台的统一的个人信息保护法规。早在4月发布的《中国人民银行2019年规章制定工作计划》中,就已经包括制定该《办法》。6月14日,央行副行长朱鹤新也表示,要研究推动个人金融信息保护立法,明确各方的权益义务,使个人金融信息保护取得实效。“监管并不意味着要取缔或禁止大数据行业,让行业规范化发展才是监管的本意。”苏宁金融研究院院长助理薛洪言向《中国新闻周刊》表示,金融行业离不开数据的支持,数据可以作为一种资产去促进金融科技的发展,促进金融业的转型,促进金融业更好地服务实体经济、普惠金融的发展,“不能偏激地理解成要为了数据保护牺牲金融科技,监管的真正意义在于规范发展”。在监管层面之外,个人金融知识教育则是数据保护的基石。亚洲开发银行研究院(ADBI)研究经济学家黄必红提议,可以借鉴日本的经验,从学生、工作人口、老年人口三个角度分别推进金融知识教育。“近年来,金融科技发展非常迅速,也代表着未来的产业发展方向。除了传统金融知识的教育,金融科技知识教育也应该纳入国民教育体系,包括一些新的金融产品,新的金融科技风险的防范。如果受到欺诈,消费者知道通过什么样的渠道保护自己。”“从过往经验看,数据灰色交易其实已存在三十多年甚至更长的时间,只是在我们步入大数据时代后,问题会被进一步放大。”中关村大数据联盟副秘书长陈新河对《中国新闻周刊》说,“目前大数据行业存在的问题仍属于发展中的问题,行业整体仍在向积极的方向前进,应该保持信心。”《中国新闻周刊》2019年第38期声明:刊用《中国新闻周刊》稿件务经书面授权

整肃爬虫公司

新普京 1

中国新闻周刊记者/杨群

近段时间,杭州市公安机关异常繁忙。最近大数据风控平台魔蝎科技的高管以及新颜科技的高管相继被警方带走;公信宝运营公司亦被杭州市公安局西湖分局古荡派出所查封。9月份,大数据风控行业迎来史上最严的查处,很多公司再次面临生存危机。

发于2019.10.21总第920期《中国新闻周刊》

整肃爬虫公司

近段时间,杭州市公安机关异常繁忙。

一个多月以来,杭州、深圳等多地公安出动警力,带走多家大数据风控平台高管协助调查。一时间,整个大数据风控行业风声鹤唳,从业者人人自危。

最近大数据风控平台魔蝎科技的高管以及新颜科技的高管相继被警方带走;公信宝运营公司亦被杭州市公安局西湖分局古荡派出所查封。

公信宝国际事务总监丁云鹏向《中国新闻周刊》透露,为配合警方调查其曾经服务的某公司,公信宝CEO黄敏强被警方带走协助调查,至今还没有消息。目前,公司已被警方查封,国内员工在家办公,海外团队暂时没有受到影响。

9月份,大数据风控行业迎来史上最严的查处,很多公司再次面临生存危机。

受此消息冲击,在魔蝎科技的高管被带走当晚,上海大数据风控平台聚信立随即向商户下发通知,表示将暂停对外提供用户授权的运营商爬虫服务。此外,鹏元征信、立木征信、白骑士等多家大数据风控服务商纷纷暂停部分服务。

一个多月以来,杭州、深圳等多地公安出动警力,带走多家大数据风控平台高管协助调查。一时间,整个大数据风控行业风声鹤唳,从业者人人自危。

源于清查“套路贷”

公信宝国际事务总监丁云鹏向《中国新闻周刊》透露,为配合警方调查其曾经服务的某公司,公信宝CEO黄敏强被警方带走协助调查,至今还没有消息。目前,公司已被警方查封,国内员工在家办公,海外团队暂时没有受到影响。

《中国新闻周刊》从多位业内人士处获悉,本轮公安机关针对大数据风控公司的行动源于催收公司拿到被害人定位信息上门催收,将人逼到跳楼自杀。这起命案让警方反过来追查数据公司倒卖个人隐私数据的责任。

受此消息冲击,在魔蝎科技的高管被带走当晚,上海大数据风控平台聚信立随即向商户下发通知,表示将暂停对外提供用户授权的运营商爬虫服务。此外,鹏元征信、立木征信、白骑士等多家大数据风控服务商纷纷暂停部分服务。

与以往不同,此次集奥聚合、同盾科技等头部平台高管先后被多地警方带走。梳理最近波及的大数据风控公司名单,高管被带走的平台几乎都集中在杭州地区。

源于清查“套路贷”

《中国新闻周刊》从警方内部人士获悉,目前相关案子杭州警方办得蛮多,具体案件主要是杭州市公安局西湖分局在办。“由于案件正在侦办过程中,具体细节都不让了解,也就是不能对外发声,领导也要求不要再问。”一位不愿具名的警方内部人士说。

《中国新闻周刊》从多位业内人士处获悉,本轮公安机关针对大数据风控公司的行动源于催收公司拿到被害人定位信息上门催收,将人逼到跳楼自杀。这起命案让警方反过来追查数据公司倒卖个人隐私数据的责任。

不过,可以确认的是,这与杭州警方近半年对“套路贷”高压态势有关。今年,打击“套路贷”是公安部部署的重要任务之一,下达到各地公安机关情况各有不同。由于杭州是互联网金融“重灾区”,各种新型网络“套路贷”案件频发。

与以往不同,此次集奥聚合、同盾科技等头部平台高管先后被多地警方带走。梳理最近波及的大数据风控公司名单,高管被带走的平台几乎都集中在杭州地区。

9月3日,公安部在河南郑州召开打击“套路贷”犯罪工作推进会。会议要求,要打掉“套路贷”团伙开发使用的非法放贷App、非法网络借贷平台,查扣银行账户及第三方支付平台的涉案资金,依法追缴,打掉专门从事非法催收业务的职业催讨团伙,依法处理。

《中国新闻周刊》从警方内部人士获悉,目前相关案子杭州警方办得蛮多,具体案件主要是杭州市公安局西湖分局在办。“由于案件正在侦办过程中,具体细节都不让了解,也就是不能对外发声,领导也要求不要再问。”一位不愿具名的警方内部人士说。

浙江省刑侦总队总队长沈虹分析了“套路贷”犯罪新趋势。他认为,“套路贷”开始由传统的线下接触式转为网上接触式。以前的套路贷犯罪模式,都是和受害人有面对面接触的过程。但现在,发展迅猛的是以网贷为依托的“现金贷”,数额小、周期短、灵活性高、欺骗性强。

不过,可以确认的是,这与杭州警方近半年对“套路贷”高压态势有关。今年,打击“套路贷”是公安部部署的重要任务之一,下达到各地公安机关情况各有不同。由于杭州是互联网金融“重灾区”,各种新型网络“套路贷”案件频发。

更早的时候,在今年3·15晚会上,警方提出了一个新词:“714高炮”。一般借款周期为7天或者14天,“高炮”是指其高额的“砍头息”及“逾期费用”。砍头息是高利贷放贷人放贷时先从本金里面扣除一部分钱作为利息。警方透露,这种“714高炮”网络套路贷已经在浙江出现。

9月3日,公安部在河南郑州召开打击“套路贷”犯罪工作推进会。会议要求,要打掉“套路贷”团伙开发使用的非法放贷App、非法网络借贷平台,查扣银行账户及第三方支付平台的涉案资金,依法追缴,打掉专门从事非法催收业务的职业催讨团伙,依法处理。

据警方介绍,这种网络“套路贷”呈现新的特点,一是散布“无息无抵押”等信息引诱人;二是通过互联网借贷平台生成借条合同;三是违规收集借款人个人信息,尤其是手机和微信通讯录等社会关系资料;四是以借条合同为掩护,收取畸高利息;五是迫使借款人“体外循环”还债或虚增债务,骗取高额利息。

浙江省刑侦总队总队长沈虹分析了“套路贷”犯罪新趋势。他认为,“套路贷”开始由传统的线下接触式转为网上接触式。以前的套路贷犯罪模式,都是和受害人有面对面接触的过程。但现在,发展迅猛的是以网贷为依托的“现金贷”,数额小、周期短、灵活性高、欺骗性强。

9月11日,杭州市公安局举行新闻通报会,今年以来有60个套路贷App被关停、19个犯罪窝点被端掉。7月份以来,杭州警方先后对多个“现金贷”类套路贷犯罪团队集中收网,捣毁“现金贷”类套路贷犯罪团伙8个,抓获违法犯罪人员300余名,其中采取刑事强制措施140余名,冻结涉案资金、资产7600余万元。

更早的时候,在今年3·15晚会上,警方提出了一个新词:“714高炮”。一般借款周期为7天或者14天,“高炮”是指其高额的“砍头息”及“逾期费用”。砍头息是高利贷放贷人放贷时先从本金里面扣除一部分钱作为利息。警方透露,这种“714高炮”网络套路贷已经在浙江出现。

被查的这些大数据风控平台,有的为“高炮”平台提供风控服务、贷超导流服务,有些还亲自下场放贷。信用管家作为贷超为“高炮”平台导流。黑猫投诉显示,快钱也被多次投诉为“高炮”平台提供支付服务,沦为高利贷残害百姓的帮凶。

据警方介绍,这种网络“套路贷”呈现新的特点,一是散布“无息无抵押”等信息引诱人;二是通过互联网借贷平台生成借条合同;三是违规收集借款人个人信息,尤其是手机和微信通讯录等社会关系资料;四是以借条合同为掩护,收取畸高利息;五是迫使借款人“体外循环”还债或虚增债务,骗取高额利息。

警方还发现,在用户下载这些借钱App时,系统会要求用户开放手机内的通讯录、通话记录等隐私信息。很多人为了几千块的借款,个人隐私完全暴露。此次,杭州警方的雷霆行动,足以让这些大数据平台胆战心惊。

9月11日,杭州市公安局举行新闻通报会,今年以来有60个套路贷App被关停、19个犯罪窝点被端掉。7月份以来,杭州警方先后对多个“现金贷”类套路贷犯罪团队集中收网,捣毁“现金贷”类套路贷犯罪团伙8个,抓获违法犯罪人员300余名,其中采取刑事强制措施140余名,冻结涉案资金、资产7600余万元。

实际上,监管对大数据风控行业一直保持高压态势,分别在2017年现金贷平台泛滥和2018年电信诈骗案件高发时,进行了两次大规模的打击,并且系统地调查了几十家大数据风控平台的真实情况。

被查的这些大数据风控平台,有的为“高炮”平台提供风控服务、贷超导流服务,有些还亲自下场放贷。信用管家作为贷超为“高炮”平台导流。黑猫投诉显示,快钱也被多次投诉为“高炮”平台提供支付服务,沦为高利贷残害百姓的帮凶。

“最近,警方调查大数据风控平台的起源,并非是保护个人信息,更可能是为了打击‘套路贷’。”维信金科副总裁李宁对《中国新闻周刊》透露,当数据行业缺乏自律时,尤其是套路贷案件出现人命官司后,反过来警方就会追究,谁为“套路贷”平台提供了系统、数据和催收,这才会涉及数据安全。

警方还发现,在用户下载这些借钱App时,系统会要求用户开放手机内的通讯录、通话记录等隐私信息。很多人为了几千块的借款,个人隐私完全暴露。此次,杭州警方的雷霆行动,足以让这些大数据平台胆战心惊。

世博会上的同盾科技展台。图/IC

实际上,监管对大数据风控行业一直保持高压态势,分别在2017年现金贷平台泛滥和2018年电信诈骗案件高发时,进行了两次大规模的打击,并且系统地调查了几十家大数据风控平台的真实情况。

爬虫高管被拘捕

“最近,警方调查大数据风控平台的起源,并非是保护个人信息,更可能是为了打击‘套路贷’。”维信金科副总裁李宁对《中国新闻周刊》透露,当数据行业缺乏自律时,尤其是套路贷案件出现人命官司后,反过来警方就会追究,谁为“套路贷”平台提供了系统、数据和催收,这才会涉及数据安全。

随着互联网金融的兴起,大数据风控公司头部企业同盾科技、百融云创、聚信立、集奥聚合等平台在2013年前后成立。此次,这些头部平台均不同程度卷入调查,尤其是同盾科技两名爬虫业务负责人被拘捕更为引人关注。

爬虫高管被拘捕

9月27日,同盾科技相关负责人向《中国新闻周刊》确认,公司旗下爬虫业务负责人童保华、徐斐为配合警方调查曾经服务的某第三方单位,正在协助警方调查取证,具体被带走时间不清楚。

随着互联网金融的兴起,大数据风控公司头部企业同盾科技、百融云创、聚信立、集奥聚合等平台在2013年前后成立。此次,这些头部平台均不同程度卷入调查,尤其是同盾科技两名爬虫业务负责人被拘捕更为引人关注。

就在十天前,有消息传出“同盾科技爬虫部门已解散,该部门员工集体待岗,并被建议不要离开杭州,否则有被抓风险。由于局面失控,同盾科技实控人兼CEO蒋韬已出国避风头”。

9月27日,同盾科技相关负责人向《中国新闻周刊》确认,公司旗下爬虫业务负责人童保华、徐斐为配合警方调查曾经服务的某第三方单位,正在协助警方调查取证,具体被带走时间不清楚。

针对网络传言,同盾科技发布蒋韬署名的《心存敬畏
向善而行》公开信,信中称“我在杭州,一切安好,欢迎来聚”,并表示要“宽容创新”等。

就在十天前,有消息传出“同盾科技爬虫部门已解散,该部门员工集体待岗,并被建议不要离开杭州,否则有被抓风险。由于局面失控,同盾科技实控人兼CEO蒋韬已出国避风头”。

9月29日,同盾科技联合创始人兼技术副总裁张新波和同盾科技副总裁李伟东接受了《中国新闻周刊》的采访。

针对网络传言,同盾科技发布蒋韬署名的《心存敬畏
向善而行》公开信,信中称“我在杭州,一切安好,欢迎来聚”,并表示要“宽容创新”等。

张新波是同盾科技四位联合创始人之一,主要负责底层技术。2009年,张新波比蒋韬晚大约一个月加入阿里巴巴,成为国际交易风控与反欺诈团队的早期成员。2009年至2011年,他全程参与阿里巴巴国际站风控与反欺诈系统的建设。后来,阿里巴巴成立集团安全部,蒋韬是技术总监,他是技术专家。

9月29日,同盾科技联合创始人兼技术副总裁张新波和同盾科技副总裁李伟东接受了《中国新闻周刊》的采访。

2013年,张新波与蒋韬、祝伟、马骏驱四人成立同盾科技。最初,同盾科技想从电商和支付的反欺诈切入。不过,由于缺乏品牌知名度、团队规模较少以及产品不成熟,迟迟打不开银行的业务。一直到2015年,同盾科技才有了第一个银行客户,替三峡银行做风控咨询的解决方案。

张新波是同盾科技四位联合创始人之一,主要负责底层技术。2009年,张新波比蒋韬晚大约一个月加入阿里巴巴,成为国际交易风控与反欺诈团队的早期成员。2009年至2011年,他全程参与阿里巴巴国际站风控与反欺诈系统的建设。后来,阿里巴巴成立集团安全部,蒋韬是技术总监,他是技术专家。

与银行业务不同,同盾科技的互联网客户发展却很快,尤其是互联网金融的客户。近几年,互联网金融业务占比在逐步下降,一方面是行业公司数量在降低,另一方面也是为了迎合监管不得已做的转型。

2013年,张新波与蒋韬、祝伟、马骏驱四人成立同盾科技。最初,同盾科技想从电商和支付的反欺诈切入。不过,由于缺乏品牌知名度、团队规模较少以及产品不成熟,迟迟打不开银行的业务。一直到2015年,同盾科技才有了第一个银行客户,替三峡银行做风控咨询的解决方案。

而在平安保险、外资银行和平安银行工作多年的李伟东加入,对同盾来说,则是更加增强了与持牌金融机构合作的能力。同盾科技方面透露,李伟东加入同盾后,同盾在银行方面业务翻了一倍。最新数据显示,同盾科技客户总数已突破一万家,其中50%互联网机构和50%金融机构。

与银行业务不同,同盾科技的互联网客户发展却很快,尤其是互联网金融的客户。近几年,互联网金融业务占比在逐步下降,一方面是行业公司数量在降低,另一方面也是为了迎合监管不得已做的转型。

同盾科技在声明中表示,信川科技是同盾科技旗下全资子公司,数聚魔盒为信川科技旗下的独立品牌产品。同盾科技相关负责人对《中国新闻周刊》表示,信川科技自2018年开始已逐步调整业务,至今年3月爬虫业务已经全部下线,原有部门员工也已经调整至其他部门正常工作。

而在平安保险、外资银行和平安银行工作多年的李伟东加入,对同盾来说,则是更加增强了与持牌金融机构合作的能力。同盾科技方面透露,李伟东加入同盾后,同盾在银行方面业务翻了一倍。最新数据显示,同盾科技客户总数已突破一万家,其中50%互联网机构和50%金融机构。

徐斐曾就职于阿里巴巴6年,与蒋韬是老同事。2014年,她加入同盾科技后任副总裁,负责互联网金融、电商O2O、三方支付等领域反欺诈工作。另一位被查的童保华,曾经就职于另外一家头部大数据风控平台聚信立,2016年被挖到同盾科技出任数聚魔盒商务总经理。

同盾科技在声明中表示,信川科技是同盾科技旗下全资子公司,数聚魔盒为信川科技旗下的独立品牌产品。同盾科技相关负责人对《中国新闻周刊》表示,信川科技自2018年开始已逐步调整业务,至今年3月爬虫业务已经全部下线,原有部门员工也已经调整至其他部门正常工作。

企查查信息显示,信川科技成立于2016年5月,原来法定代表人为蒋韬,今年6月26更改为徐斐。一位业内人士向《中国新闻周刊》分析,同盾科技一开始将爬虫业务剥离出去单独设立信川科技,以及几个月前将相关公司法定代表人进行变更,就有着规避风险和“弃卒保车”的考虑。

徐斐曾就职于阿里巴巴6年,与蒋韬是老同事。2014年,她加入同盾科技后任副总裁,负责互联网金融、电商O2O、三方支付等领域反欺诈工作。另一位被查的童保华,曾经就职于另外一家头部大数据风控平台聚信立,2016年被挖到同盾科技出任数聚魔盒商务总经理。

P2P网贷等服务平台,是爬虫获取大数据的重要渠道之一。图/IC

企查查信息显示,信川科技成立于2016年5月,原来法定代表人为蒋韬,今年6月26更改为徐斐。一位业内人士向《中国新闻周刊》分析,同盾科技一开始将爬虫业务剥离出去单独设立信川科技,以及几个月前将相关公司法定代表人进行变更,就有着规避风险和“弃卒保车”的考虑。

如何爬取数据?

如何爬取数据?

数聚魔盒是信川科技的核心产品,主要涉及数据采集流程,支持爬取数据用作信用评估。

数聚魔盒是信川科技的核心产品,主要涉及数据采集流程,支持爬取数据用作信用评估。

公开信息显示,数聚魔盒团队服务的客户主要来自互联网金融机构,包括了P2P网贷、消费金融、理财、保险、车房租赁等。成立仅仅6个多月,就已经有超过100家金融机构使用数聚魔盒产品,累积超过200万次数据调用量。

公开信息显示,数聚魔盒团队服务的客户主要来自互联网金融机构,包括了P2P网贷、消费金融、理财、保险、车房租赁等。成立仅仅6个多月,就已经有超过100家金融机构使用数聚魔盒产品,累积超过200万次数据调用量。

2018年8月,数聚魔盒举行产品升级发布会,推出全新产品“万象”系列,与之前的魔方系列、百川平台形成三大产品系列。其中,魔方是面向消费金融、信贷、汽车金融等客户提供魔方报告;百川是面向银行、政府、大型企业提供数据采集整体解决方案;万象是以多方数据沉淀为基础,数据分析及建模为核心,面向金融机构提供智能决策及欺诈风险判断。

2018年8月,数聚魔盒举行产品升级发布会,推出全新产品“万象”系列,与之前的魔方系列、百川平台形成三大产品系列。其中,魔方是面向消费金融、信贷、汽车金融等客户提供魔方报告;百川是面向银行、政府、大型企业提供数据采集整体解决方案;万象是以多方数据沉淀为基础,数据分析及建模为核心,面向金融机构提供智能决策及欺诈风险判断。

为保证采集多维数据的基础上兼顾用户隐私,数聚魔盒采用“爬取互联网公开数据+打通同盾体系内数据+用户授权数据采集”交叉关联的形式,通过用户授权,利用网页极速抓取技术获取各类用户个人数据,通过海量数据比对和分析,交叉验证,最终为各类机构提供用户的风险分析判断。

为保证采集多维数据的基础上兼顾用户隐私,数聚魔盒采用“爬取互联网公开数据+打通同盾体系内数据+用户授权数据采集”交叉关联的形式,通过用户授权,利用网页极速抓取技术获取各类用户个人数据,通过海量数据比对和分析,交叉验证,最终为各类机构提供用户的风险分析判断。

在此三大产品体系下,数聚魔盒能够满足不同业务场景的需求,已经为银行、保险、汽车金融、小微企业、非银行信贷、消费金融、电商等多个行业客户提供基于大数据的智能决策服务。截至2018年,数聚魔盒已经服务了超过2000家海内外客户,累计超过亿的数据调用量,覆盖了超过8000万独立用户,连接了超过亿人的关系网络。

在此三大产品体系下,数聚魔盒能够满足不同业务场景的需求,已经为银行、保险、汽车金融、小微企业、非银行信贷、消费金融、电商等多个行业客户提供基于大数据的智能决策服务。截至2018年,数聚魔盒已经服务了超过2000家海内外客户,累计超过亿的数据调用量,覆盖了超过8000万独立用户,连接了超过亿人的关系网络。

张新波将信川科技定位为一家技术公司,主要是通过数据采集工具帮助客户采集信息。对于爬虫技术,他认为是“技术中立”的,“原本这些信息就需要向金融机构提供,用户自己打印截图跟我们帮他爬虫是一样的。爬虫就是一个工具,帮他把数据自动采集下来,然后倒进去而已。”

张新波将信川科技定位为一家技术公司,主要是通过数据采集工具帮助客户采集信息。对于爬虫技术,他认为是“技术中立”的,“原本这些信息就需要向金融机构提供,用户自己打印截图跟我们帮他爬虫是一样的。爬虫就是一个工具,帮他把数据自动采集下来,然后倒进去而已。”

为此,维信金科副总裁李宁特意区分爬虫和采集。他认为,爬虫是你到互联网上在别人不知情下获取数据;如果用户在某一特定情况下,授权你去访问,那就叫采集。爬虫和采集是两码事。当然,即便是采集完了也只能在授权范围之内使用,有限度地使用,而不能够将数据私自储存,稍微包装一下卖给第三方。

为此,维信金科副总裁李宁特意区分爬虫和采集。他认为,爬虫是你到互联网上在别人不知情下获取数据;如果用户在某一特定情况下,授权你去访问,那就叫采集。爬虫和采集是两码事。当然,即便是采集完了也只能在授权范围之内使用,有限度地使用,而不能够将数据私自储存,稍微包装一下卖给第三方。

数据采集要如何做到授权和合规?张新波认为,第一,采集什么数据需要告知客户;第二,需要采集网站的用户名和密码需要客户自己填进去,经过授权。

数据采集要如何做到授权和合规?张新波认为,第一,采集什么数据需要告知客户;第二,需要采集网站的用户名和密码需要客户自己填进去,经过授权。

对此,李宁认为当前很多大数据公司都做不到完全合规。首先,要求客户授权是一个强制措施,不授权不能使用;其次,没有告诉客户授权的具体内容,很可能过度采集客户信息;再次,让客户自己将用户名和密码填进去授权,其实是在打擦边球;最后,授权的文件十分冗长,大部分人都不可能从专业律师拟定的条款中挑出任何毛病,只能乖乖签字。

对此,李宁认为当前很多大数据公司都做不到完全合规。首先,要求客户授权是一个强制措施,不授权不能使用;其次,没有告诉客户授权的具体内容,很可能过度采集客户信息;再次,让客户自己将用户名和密码填进去授权,其实是在打擦边球;最后,授权的文件十分冗长,大部分人都不可能从专业律师拟定的条款中挑出任何毛病,只能乖乖签字。

因爬虫数据获刑

因爬虫数据获刑

大数据风控行业再次遭遇监管打击,从业者从中感受到瑟瑟寒意。

大数据风控行业再次遭遇监管打击,从业者从中感受到瑟瑟寒意。

大成律师事务所合伙人肖飒每天都要接待来自大数据行业从业者的来访和来电,大家关注的焦点话题是:什么情况下会被警方带走?怎样就算是涉嫌犯罪?哪些产品存在问题?

大成律师事务所合伙人肖飒每天都要接待来自大数据行业从业者的来访和来电,大家关注的焦点话题是:什么情况下会被警方带走?怎样就算是涉嫌犯罪?哪些产品存在问题?

“大家关注的焦点就在于自己行为是否合规,而且更关心是否刑事合规。因为一般的合规而言只是罚款,而一旦刑事不合规,则会面临牢狱之灾。”肖飒对《中国新闻周刊》解释道。

“大家关注的焦点就在于自己行为是否合规,而且更关心是否刑事合规。因为一般的合规而言只是罚款,而一旦刑事不合规,则会面临牢狱之灾。”肖飒对《中国新闻周刊》解释道。

肖飒认为,大数据行业是一个有风险的行业,从业者或多或少知道自己的业务有一定风险。但是一直以来,大数据行业刑事风险较少,个人信息泄露基本上还未和大数据行业联系的很紧密。所以,权衡之下,大部分从业者在利益诱惑下还是坚持做下去。一旦刑事风险出现,大部分从业者就很慌张。

肖飒认为,大数据行业是一个有风险的行业,从业者或多或少知道自己的业务有一定风险。但是一直以来,大数据行业刑事风险较少,个人信息泄露基本上还未和大数据行业联系的很紧密。所以,权衡之下,大部分从业者在利益诱惑下还是坚持做下去。一旦刑事风险出现,大部分从业者就很慌张。

长期以来,个人信息泄露归类到个人保护不当或黑客的原因。2016年,徐玉玉等一系列电信诈骗案出现,使得社会舆论集中关注到个人隐私信息被批量贩卖。一个纯真无邪的女生因为个人隐私泄露被骗身亡,引起全社会的极度愤怒,更是大幅度地推动《网络安全法》的出台。

长期以来,个人信息泄露归类到个人保护不当或黑客的原因。2016年,徐玉玉等一系列电信诈骗案出现,使得社会舆论集中关注到个人隐私信息被批量贩卖。一个纯真无邪的女生因为个人隐私泄露被骗身亡,引起全社会的极度愤怒,更是大幅度地推动《网络安全法》的出台。

2017年5月,在《网络安全法》正式实施前夕,监管针对大数据乱象出手,先后将30家大数据风控平台列入调查,其中就有几家估值高达数十亿元。

2017年5月,在《网络安全法》正式实施前夕,监管针对大数据乱象出手,先后将30家大数据风控平台列入调查,其中就有几家估值高达数十亿元。

大数据行业因爬虫数据获刑的要算北京数据堂。在两年前那次监管打击中,北京数据堂的多名高管被带走,原因就是大肆买卖用户个人信息,其中涉及隐私性的数据。这家成立于2011年,2014年底在新三板上市的大数据风控公司,核心业务就是大数据的采集、处理和挖掘。警方在侦查中发现,北京数据堂在八个月内日均传输公民个人信息1.3亿条,数据大多是爬虫得来。

大数据行业因爬虫数据获刑的要算北京数据堂。在两年前那次监管打击中,北京数据堂的多名高管被带走,原因就是大肆买卖用户个人信息,其中涉及隐私性的数据。这家成立于2011年,2014年底在新三板上市的大数据风控公司,核心业务就是大数据的采集、处理和挖掘。警方在侦查中发现,北京数据堂在八个月内日均传输公民个人信息1.3亿条,数据大多是爬虫得来。

然而在李宁看来,真正运用《网络安全法》和《个人隐私保护法》进行精准判决的案子仍属少见。这也造成上轮监管打击,并没有产生足够震慑。于是时隔一年,大数据行业又迎来第二轮收网式打击。

然而在李宁看来,真正运用《网络安全法》和《个人隐私保护法》进行精准判决的案子仍属少见。这也造成上轮监管打击,并没有产生足够震慑。于是时隔一年,大数据行业又迎来第二轮收网式打击。

2018年11月,针对大数据行业乱象,监管再次带走大量从业者调查。这一次监管针对的是公民信息泄露,其中数据不乏来自政府单位。甚至有的电信诈骗分子会伪装成公检法人员,利用的便是公众对公检法机构人员的畏惧和公安身份查询接口返回的高清网纹身份证照片。

2018年11月,针对大数据行业乱象,监管再次带走大量从业者调查。这一次监管针对的是公民信息泄露,其中数据不乏来自政府单位。甚至有的电信诈骗分子会伪装成公检法人员,利用的便是公众对公检法机构人员的畏惧和公安身份查询接口返回的高清网纹身份证照片。

时隔不到一年,2019年9月,大数据行业迎来第三轮整顿。此轮整顿原由,警方并未对外公布。不少业内人士表示,与第三方数据平台为“714高炮”平台、套路贷平台提供数据服务,非法倒卖个人隐私信息脱不开关系。

时隔不到一年,2019年9月,大数据行业迎来第三轮整顿。此轮整顿原由,警方并未对外公布。不少业内人士表示,与第三方数据平台为“714高炮”平台、套路贷平台提供数据服务,非法倒卖个人隐私信息脱不开关系。

社科院金融研究所法与金融研究室副主任尹振涛认为,这次大数据风控行业整顿,主要还是与之前电信诈骗专项整治有关,当然也和互联网金融风险转向整治有关,主要还是个人隐私等问题,金融业务相对较少。

社科院金融研究所法与金融研究室副主任尹振涛认为,这次大数据风控行业整顿,主要还是与之前电信诈骗专项整治有关,当然也和互联网金融风险转向整治有关,主要还是个人隐私等问题,金融业务相对较少。

西南财经大学普惠金融与智能金融研究中心副主任陈文则表示,现在这些大数据风控公司被查大多是公安机关出动,并非监管出动。公安机关查处的部分大数据风控公司涉及现金贷业务以及暴力催收问题,属于打黑除恶行动的延续。当然,这个过程中也有部分公司是因为未经授权“爬虫”获得数据并违规使用带来的侵害个人信息隐私等问题被查处。

西南财经大学普惠金融与智能金融研究中心副主任陈文则表示,现在这些大数据风控公司被查大多是公安机关出动,并非监管出动。公安机关查处的部分大数据风控公司涉及现金贷业务以及暴力催收问题,属于打黑除恶行动的延续。当然,这个过程中也有部分公司是因为未经授权“爬虫”获得数据并违规使用带来的侵害个人信息隐私等问题被查处。

《中国新闻周刊》2019年第38期

声明:刊用《中国新闻周刊》稿件务经书面授权

发表评论

电子邮件地址不会被公开。 必填项已用*标注

相关文章

网站地图xml地图