各大社区内容过滤_内容过滤推荐系统
各大社区内容过滤由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“内容过滤推荐系统”。
反垃圾信息网络社区联盟
百度贴吧建立了包括 机器识别、特殊事件处理、人工协同、垃圾信息警示等; 开心网通过增加验证次数、关闭注册地址的方式限制“马甲”用户恶意灌水; 天涯社区重点监管巡查对可疑IP、ID实现了批量注销处理
用户投诉24小时响应处理
垃圾信息的特征提取:包括URL、图片、电话、QQ号码
反垃圾后台:垃圾信息数据库与过滤系统
天涯反垃圾后台拥有庞大的垃圾信息数据库,通过对用户提交的信息内容进行识别和过滤,当其符合垃圾信息的特征时,系统会自动对这些信息进行删除处理。
垃圾信息过滤系统,能随时添加关键词;能随时添加词库
ID后台管理
反垃圾人员通过站内消息对可疑IP注册的众多ID进行审核,通过邮箱、加密密码等条件判断是否为垃圾ID,并做出相应处理。
用户回复监控
通过回复监控及时发现垃圾信息,并对垃圾信息进行注销轨迹。同时,根据已有信息追踪更多相关内容,对现有的垃圾内容及形式特点做出归纳及应对,且可对以后垃圾信息的变化做出预防措施。
用户举报系统
用户举报系统由自动举报处理和人工举报处理共同组成,依托网友举报和系统对关键词的过滤,发现垃圾信息及时进行注销轨迹处理,系统关键词实时更新。
搜狐:通过关键词审核和初级用户按等级审核两种方式。
文字内容方面社区将含有特有关键词的垃圾信息先进行机器自动过滤,过滤后的信息再次进行人工审核
对于批量灌水的可对用户进行ID、IP、机器码三种批量删除方式。
对上传到社区的图片审核后台先进行自动识别分类,将正常图片和垃圾信息图片分开审核,以确保审核效率。
目前,开心网采取了多种方式来净化网络环境,对发布的信息进行管理,具体而言,主要包
括以下方式:
(1)对用户进行管理。通过实名注册系统,杜绝“小号”的出现,保证用户不会受到干扰,用户体验不会受到影响;
(2)采用“关键词过滤”的方法。通过对关键词进行检索和过滤,从而筛除与色情、暴力、非法等相关的垃圾信息,避免对用户造成负面影响;
(3)人工审核方式。除了技术手段,还建立了审核制度,以人工的方式对所有发布信息进行一一审核,最大程度上避免垃圾信息在网站上出现。
百度贴吧:
1)机器识别机制:贴吧拥有庞大的垃圾信息特征库,通过对用户提交的信息内容进行识别
和匹配,当其特征符合垃圾信息的标准时,贴吧会自动对这些信息进行删 除清理;此外,针对用户在贴吧中的活动和行为,贴吧也有相应的判别机制,当用户行为异常,如短时间内提交内容相似的贴子内容,也将进行相应的处理。
2)特殊事件处理机制:针对爆吧、大批量垃圾信息发送者,贴吧拥有一套完整的预警机制,能够自动响应并做出相应的防御部署,将由此产生的垃圾信息予以删除清理。
3)人工处理协同机制:技术和机器的判别永远都不可能做到100%的杜绝垃圾信息,为此,贴吧开发了一系列辅助技术,依赖吧主和网友的力量,共同应对垃 圾信息。其中最重要的技术是“神兽”和“静止蛙技术”:所谓“神兽”,当该机制开启时,用户的所有发贴都需要输入超级验证码,会大大提高垃圾信息发布的门 槛,让发贴机或者人工大批量发贴难以施展;所谓“静止蛙技术”,则主要针对一些爆吧、顶旧贴子的现象,当开启这一技术后,相应吧的非会员ID将不能回复旧 的贴子。
4)垃圾信息警示机制:针对部分容易招致垃圾广告信息的贴吧,百度采用在醒目位置提示的方式,提醒广大网友,避免被垃圾广告信息误导,防止上当受 骗。目前贴吧反垃圾信息处理成效:
1、垃圾信息存活量不足1%。这在全球论坛社区、社交网络平台中,都处于领先地位。
2、日均清除垃圾信息100万条。贴吧依靠完善的反垃圾信息处理技术来 完成贴子的处理,并形成了技术处理、吧主协同、网友举报的垃圾信息立体整治网络。
社区验证码策略