首先是操做collections库的Counter函数对数据的重复值停行查察,何处次要是对岗亭的url停行了统计查察,可以通过结果看出,每个url都只显现了一次,也便是说,每条数据都只显现了一次,并未显现重复值,因而,不用对数据停行去重收配。依据占比率前十的职位类别统计,对职位类别停行环状扇形图的涌现。依据职位类其它数质统计,对所有职位类别停行词云图涌现,从词云图可以看出计较机软件、互联网、电子商务、计较机效劳等职位类别对大数据专业相关岗亭的需求比较大,求职者正在求职的时候可以先思考那些岗亭类其它雇用。