关键词过滤
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
关键词过滤,也称关键字过滤,指网络应用中,对传输信息进行预先的程序过滤、嗅探指定的关键字词,并进行智能识别,检查网络中是否有违反指定策略的行为。类似于IDS的过滤管理,这种过滤机制是主动的,通常对包含关键词的信息进行阻断连接、取消或延后显示、替换、人工干预等处理。
关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有:网络访问、论坛、网志、即时通讯、电子邮件等。
1.路由器关键词过滤
在路由器、网关、防火墙中设置关键词过滤,对URL、数据包进行酌别。可用于对内部网对外通讯进约束,也可用于互联网的管理。
最著名的路由器级关键词过滤系统可能是防火长城。
2.应用服务关键词过滤
论坛、网游、新闻评论、网志等互联网应用的服务器端进行过滤,常用于对色情、暴力、宗教或其它策略要求的言论进行控制。
通常对关键词的信息不予显示、替换或转人工审查。
3.终端软件关键词过滤
网络应用软件自身附带关键词列表,对指定关键词进行处理。
QQ(包括QQ游戏)、VeryCD版eMule 、TOM-SKYPE等中国网络软件中,被很多使用这些软件的网友发现有内容几乎相同的关键字词过滤文件。
在2006年,有中国黑客发现QQ有一套过滤词汇表,是QQ游戏目录下的COMToolKit.dll,[1][2]过滤词汇内容与emule的关键词过滤文件内容几乎相同。这套过滤程序收录了1041个词汇,与性相关的约占15%,其余基本都是与政治相关。由于中国网络审查缺乏对公众透明,这个关键词过滤文件是否是由中国的网络警察创作的,目前没有明确的说法。
同年,eMule VeryCD中文版也有一个关键词过滤文件被黑客发现,搜索这个文件当中的审查词汇时,搜索结果返回全是乱码或没有搜索结果。