内容过滤
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
内容过滤是指对经过防火墙的信息进行监测,可以按照用户需求,禁止带有色情、反动或任何用户希望禁止的信息浏览或被浏览。
内容过滤的由来:因特网内容选择平台是一项1995年开始启用的技术标准,它是由一家非营利性因特网开放商联盟—— 万维网联盟(W3C)为解除1995年年末出台的美国《通讯正派条例》(该条例于1997年被否决)的威胁而推出的。因特网内容选择平台的设计理念是鼓励自由表达、保护未成年人的权益,把工具交给父母或其他人,让他们为自己和自己的孩子过滤内容。这类工具同时还可以将孩子或雇员送出的不恰当信息滤掉,比如家庭地址、信用卡号码和机密的公司信息等等。
内容过滤技术一般包括名单过滤技术、关键词过滤技术、图像过滤技术、模板过滤技术和智能过滤技术等。目前,内容过滤技术还处于初级阶段,实用的技术相对比较单一,主要表现在名单过滤和关键词过滤技术,而图像过滤与模板过滤技术还处于起步阶段,面I临着图片的智能识别和过滤对机器或网络性能存在负面影响的障碍。现阶段的内容过滤技术主要是对URL网址过滤和网页文字等固定内容过滤,还无法做到智能的判断,这是内容过滤技术在现阶段的不足。
目前大多过滤技术在网络处理的应用层实现,适应性和安全性较差。现阶段的内容过滤技术主要分为基于网关和基于代理两种,二者都不能解决的问题是对网络速度的负面影响,而且因为是串行处理,如果网关和代理出现故障都会使网络不通。
网关与代理方式的区别是工作于网络的不同层次。网关是在网络层上处理数据,其特点是处理效率高、速度快,但要求内容过滤技术十分全面,因为内容过滤大部分是必须针对应用层进行的,这样就需要过滤产品能够对全部网络层的数据进行应用层的分析。而代理是在应用层上处理,其特点是易于实现,但对硬件处理速度要求高,同时还需要对一些非应用层代理进行分析。内容过滤技术最终的发展方向必然是实时、准确、智能地进行内容分类。目前需要进一步研究和实用化的技术有:中文的词义/语义分析和图形的识别。技术在不断发展,已有的应用在后台处理中随着技术的成熟以及硬件处理速度的不断提高,相信实时、智能的过滤产品将会在市场上出现。