垃圾短信
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
什么是垃圾短信[1]
根据《中国互联网协会短信息服务规范》和《中国互联网协会反垃圾短信息自律公约》相关条款规定,垃圾短信的定义为:未经用户同意向用户发送的用户不愿意收到的短信息,或用户不能根据自己的意愿拒绝接收的短信息。主要包含未经用户同意向用户发送的商业类、广告类等短信息;其他违反行业自律性规范的短信息;以及违反国家有关法律法规的和低级恶俗的短信息。
垃圾短信的主要形式[1]
根据短信内容的不同,可以将垃圾短信分为四种形式:违法短信、服务提供商(ServiceProvider,SP)诈骗短信、不良信息短信、商业广告短信。
1、违法短信
违法短信主要是指由不法分子以进行违法活动或传播不法信息为目的发送的短信。不法之徒利用手机短信作案主要有如下三种形式:
(1)通过发送手机短信进行诈骗,骗取他人钱财。例如使用短信群发器向手机用户发送假的中奖、信用卡透支等信息,诱使接收用户上当受骗。
(2)利用手机短信从事制作假证件、假公章、假学历、考前出卖试题等违法经营活动。
(3)通过手机短信散布破坏民族团结、影响社会稳定的政治谣言或有害信息,如果放任此种有害信息传播,会对国家安全造成严重危害。
2、SP诈骗短信
随着手机的迅速普及,移动通信运营商与众多服务提供商(简称为SP)合作向用户推出各种增值服务,SP通过运营商的网络平台向手机用户提供资讯、娱乐、商务等各种数据业务服务。
这种数据业务一方面使用户可以方便地通过手机得到各种所需的服务,另一方面也在SP、电信运营商和用户之间形成了一条经济链条。随着数据业务的迅速发展,这方面的问题也成为客户投诉的热点。不少SP利用消费者的信任和相关部门管理的疏漏,利用电信网络的复杂性进行违规操作,以手机短信为媒介,构建各种收费陷阱,从消费者身上牟取不合理费用。
不良SP制造“短信陷阱”一般通过两种渠道:一种是通过电信运营商向消费者发送“诱惑短信”,用户一旦回复短信就被当作确认定购服务;另一种是在互联网上设置“陷阱”,“诱惑”用户发送短信确认。
3、不良信息短信
此类短信因其内容低俗,格调低下,被称为“精神污染”。其中带有迷信、色情内容的短信,对社会造成了极大的危害。由于手机网络的快速繁衍特性,短信已经成为不健康信息的传播途径,使得封建迷信、低级下流话语的生存空间急速扩张。尤其对未成年人,随着手机在青少年中的普及,不良信息的社会危害性更为严重。对某市一所重点中学初三年级的100名同学进行了调查,调查结果显示接近半数的学生都有自己的手机,并且70%的同学曾收到过不良信息。
4、商业广告短信
此类短信多为各短信广告公司,利用短信群发设备,大面积散发的一种短信形式。此种短信主要具有以下四个特点:
(1)覆盖面广。使用特殊的短信群发设备,只要选择好手机或小灵通的一个号段,把开始的号码和最后一个号码输入软件即可,并且发送的成功率至少在95%以上。
(2)费用低。目前,市场上通行的短信广告的服务价格为三至四分钱一条,这意味着即便是发送给一百万人,也只需花费三到四万元,甚至更低。
(3)效果好,由于手机用户只有在阅读短信的内容之后,才能发现此条短信为广告短信,此时用户已经被迫洗脑。广告行业以“千人到达率”来评估广告效果,与传统媒体广告相比,短信广告的到达率几乎是百分之百。
(4)隐蔽性强,相比于传统媒体广告,利用手机短信为载体的商业广告私密性较强,用户阅读之后会立即删除,因此一些敏感商品或者不适合在公开场合做广告的产品,可以肆无忌惮地通过手机短信的形式传播。
垃圾短信的主要特征[1]
通过对大量垃圾短信的研究,总结出垃圾短信有如下几个主要的特征:
1、绝大多数垃圾短信的文本内容与正常短信的文本内容相一致,垃圾短信的特征并不明显,只有少数的垃圾短信含有明显的特征,但垃圾短信的字数通常比正常短信的字数要多。
2、垃圾短信中多包含邮箱、电话、住址、商品名称等信息,这些信息也是判断垃圾短信的重要依据。
3、垃圾短信通常使用暗语或寓意来表示隐含的意思,使得过滤系统无法仅从短信内容的单个关键字,对短信正确的分类。
4、为了逃避基于关键字的过滤方法,有些垃圾短信用标点符号和空格来将词分开,或者是用拼音来代替其中的一些汉字,又或者使用干扰字符、繁体字、谐音字等抗过滤方式,影响垃圾短信的过滤效果。
国内垃圾短信的整治情况[1]
根据2008年9月《垃圾短信息整治专项行动阶段性工作情况通报》指出,我国垃圾短信整治工作,在以下几方面取得了阶段性的成果。
1、清理整改行业类应用等短信息端口
各省通信管理局组织本地基础电信企业从管理规范、技术手段、合同约定等方面综合采取措施杜绝行业类应用等短信息端口滥发垃圾短信息的行为。在清理规范方面,重点排查关闭了一批交叉使用端口、跨区发展用户、发送内容与签约不符等超范围滥发短信息端口,以及转让、租借的短信息端口。其中,仅浙江省关闭和迁移违规端口达563个。在技术手段方面,各电信运营公司通过网络自动加载方式要求合作单位须实名签名发送短信息,贵州等地的实名签名准确率达到100%。在合同约定方面,基础电信企业对相关合同进行了全面清理和修订,增加了要求合作单位必须事先经用户确认、限定发送内容等约定及违约处罚条款。
2、清理规范SP短信息群发平台
各地基础电信企业加大拨测力度,对所接入的SP短信息群发服务进行全面清查。各地移动公司与SP签订责任保证书,对垃圾短信息等不良信息行为进行具体违约处罚规定。
3、联动处理网间垃圾短信息
陕西、山东等省通信管理局组织本地基础电信企业研究制定了网间联动处理机制,并明确了联动处理原则、处理流程和处理时限,以及各相关方的责任和义务,有效解决了目前网间垃圾短信息处理不畅的问题。据统计,2009年6月山东移动公司,共计处理网间垃圾短信息达31327条。
4、梳理规范违规短信息资费套餐
为加大从源头上切断垃圾短信息价值链的管理力度,各地基础电信企业对短信息业务的各类资费套餐进行了全面梳理和自查,关闭停用了部分不符合规定的套餐,并对所有在售的套餐资费进行了修改。
5、处理用户投诉举报
各省通信管理局组织当地运营企业加大垃圾短信息举报投诉的宣传及处理力度,提供电话、短信、网站等多种渠道方便用户投诉举报,并配备专职人员加快回复速度。贵州等地移动公司承诺投诉举报处理回复的时限从现行的72小时缩短为48小时。山东省通信管理局还主动与“网络不良与垃圾信息举报受理中心”建立机制,监督企业妥善处理其中涉及山东省基础电信企业的用户投诉。
现有的判断垃圾短信机制[1]
目前,各电信运营商主要采用以下几种机制实现短信息的判定:
1、基于短信发送流量判定
垃圾短信发送的重要特点之一是发送频率特别大,垃圾短信群发采用的工具是短信猫、群发软件等软硬件设备,可以达到很高的发送频率。对于垃圾短信发送者来说,只有短时间内向更多手机用户发送短信息才能达到信息宣传的目的,并且可以利用运营商的扣费时间差造成欠费节省成本。
因此,这个重要特点被利用起来作为判断垃圾短信的条件。设定单个用户某段时间内(10分钟,半小时,1小时,6小时等)发送的流量监控上限,系统对每个用户进行计数判定,当超过某个时间段的发送流量门限时,把用户作为黑名单用户进行后续人工审核或者直接拦截等后续处理。
2、基于内容包含关键字判定
从垃圾短信的内容角度来看,垃圾短信总要传递一种信息,例如走私车与黑车买卖信息,卫星接收器信息,机票销售信息等,因此内容中一定会包含特定的关键字。因此,目前很多系统都采用是否包含关键字、关键字类或者关键字组合作为垃圾短信判定条件之一。设定单个用户某段时间内(10分钟,半小时,1小时,6小时等)发送的包含某个关键字、某类关键字或者某关键字组合的流量监控上限,系统对每个用户进行计数判定,当超过某个时间段的发送关键字流量门限时,把用户作为黑名单用户进行后续人工审核或者直接拦截等后续处理。
3、基于被叫号码特征判定
从垃圾短信的群发对象角度来看,被叫号码一般会呈现一些特征。比如被叫号码全是外省号码,很多垃圾短信都是跨省发送,例如用重庆的手机号通过重庆的短信平台向广东用户发送垃圾短信;又比如采用号段群发时,被叫号码会呈现连号,隔号等特征。因此,目前有些系统采用分析同一个主叫号码发送的目标被叫号码是否呈现上述特征作为垃圾短信判定条件之一。把连续发送若干条短信时,被叫号码呈现某些特征的主叫用户作为黑名单用户进行后续人工审核或者直接拦截等后续处理。
以上几种方式虽然对垃圾短信判定有一定的作用,但是也都存在明显的缺陷和不足。仅仅基于流量判定过于粗糙,容易造成正常群发信息的误拦截,引起用户投诉;基于关键字的判定比较片面,正常短信也可能出现关键字,而且垃圾短信通常采用谐音字,干扰字符,拆分字来规避监控;基于被叫号码特征判定对于某些情况很有效,但是规则太过简单,很容易被群发垃圾短信者通过打乱群发号码进行规避。因此,本文针对现有垃圾短信分析机制的弊端,提出更有效的基于短信内容语义智能分类判断的方法来分析判断垃圾短信,旨在提高短消息分类的智能性、可靠性、准确率和实时性。