多媒体信息检索
出自 MBA智库百科(https://wiki.mbalib.com/)
目录 |
多媒体信息检索是根据用户的要求,对图形、图像、文本、声音、动画等多媒体信息进行检索,得到用户所需的信息。
多媒体信息检索系统有着广阔的应用前景,它将广泛用于电子会议、远程教学、远程医疗、电子图书馆、艺术收藏和地球资源管理、天气预报、时装设计、智能群体决策、计算机支持协同工作、金融市场、军事指挥系统、防汛指挥系统等方面。例如,数字图书馆将物理信息转化为数字多媒体形式,通过网络安全地发送给世界各地的用户;自然语言查询和要领查询对返回给用户的信息进行筛选,使相关数据更为简单和精确;聚集功能将查询结果组织在使用户能够简单地识别相关的信息;摘要功能能够对查询结果进行主要观点的概括,而使用户不必查看全部文本就可以确定所查找的信息。
多媒体信息检索系统指能对以文本信息为代表的离散媒体和以图像、声音等为代表的连续媒体的内容进行检索.为了达到较好的检索效果,必须解决以下关键技术。
1.信息模型和表示
信息模型是使用基于计算机的符号结构对应用信息模型化.多媒体信息检索信赖于多媒体信息的组织形成,多媒体信息组织的优劣在一定程度上决定了其检索效率的高低.常见的多媒体对象是构造型的复合对象,其本身可用多种数据模型.主要模型有:超文本模型、文献模型和信息元模型等。
2.检索技术
对文本信息进行全文检索和自由文本查询时,用户只需提交一个查询请求,即可找到所有涉及该关键词的文档.自由文本查询的结果是一个按照序列值排序的文档列表,相关概率最大的排在最前面.该序列根据以“词汇相似性”为基础的概率公式计算得出.对图像信息可以按照颜色、形状、纹理以及在图像中的位置对图像进行查找。
3.查询语言
传统的数据库查询语言SQL无法适应多媒体信息的检索,尽管ISO对SQL做了多次扩充,特别是在SQL3中增加了面向对象的概念和功能,并对过程加以扩充,但形式化地表达和实现用于多媒体检索的SQL,仍是非常困难的。
基于内容检索以QBE(Query By Example)为代表.这类检索直接依赖于图像理解、语音识别等模式识别技术,首先进行特征抽取,再计算其相似性.目前,计算机模式识别技术尚未完全成熟,且不存在通用、高效的算法,这是多媒体基于内容检索进一步发展的主要障碍。
4.信息压缩和恢复
将物理形式的资料转化为数字信息,并进行压缩和转化.多媒体信息载体由于采用了大量的图像、声音、影视,其数据量比传统以文字为主的单一媒体要大数百倍.数据的压缩为多媒体信息处理的一项关键技术。
5.信息存储管理
存储对象可以是文本、声音、图形、图像的数字比信息.对每一种类型的对象,可以定义它们的索引、查询支持(目录)信息.答谢存储管理采用客户/服务器模型,信息服务器管理数据(或目录)的索引和查询,而对象服务器则用于管理(或收集)数字化的对象。
6.多媒体同步技术
多媒体同步技术就是解决如何展现多媒体的空间组合问题.尤其在采用客户/服务模式的系统中,各种媒体源源分布在不同的数据库中,多媒体同步技术就是从不同的库中,将数据按时间顺序及空间缓冲区地址的安排,恰当地组合起来。