發布時間:2023-03-06 15:59:30
序言:寫作是分享個人見解和探索未知領域的橋梁,我們為您精選了8篇的壓縮技術論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發,請盡情閱讀。
關鍵詞:XML;后綴樹;后綴數組;自索引;BWT
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-7712 (2012) 06-0099-01
一、數據壓縮知識
數據壓縮技術的發展。
隨著計算機技術的飛速發展,數據壓縮作為解決海量信息存儲和傳輸的支撐技術受到了人們的極大重視,對數據壓縮算法的研究也不僅局限于信息論中有關信源編碼的范疇,數字圖像信號、語音信號的分析和處理等技術被大量引入到有關的研究領域。
1977年,兩位以色列科學家Jacob Ziv和Abraham Lempel發表了名為“A Universal Algorithm for Sequential Data Compression”(順序數據壓縮的通用算法)的論文,提出了一種不同與以往的基于字典的壓縮方法——LZ77,他們在1978年又提出了LZ77的改進算法——LZ78,這兩個算法吧數據壓縮的研究推向了一個全新的階段。1984年,Terry Weleh發表的論文“A Technique for High Performance Data Compression”(高性能數據壓縮技術)描述了對LZ78算法的改進和具體實現技術,成為LZW算法。目前,無損數據壓縮領域中流行的數據壓縮方法多是基于字典的壓縮技術。UNIX系統上的一個實用壓縮軟件COMPRESS和Windows系統下的壓縮軟件Winzip和Winrar中所使用的壓縮算法都是基于字典壓縮技術的。
當數據壓縮被用于減少存儲空間時,可以減少程序的總執行時間。這是因為存儲量的減少將導致磁盤存取次數的減少,雖然數據的壓縮/解壓縮過程會增加額外的程序指令,但由于程序的執行時間通常少于數據的存儲時間,因此中的執行時間將減少。也正因如此,數據壓縮技術在計算機技術飛速發展的今天仍然有著很重要的作用。
二、XML壓縮索引
(一)XML壓縮背景
上文中已經述說了XML的優點,但和其它形式的數據表示相比,XML文檔往往很大。因此有些時候,傳輸速度和存儲空間會非常重要。具體來說:
1.XML是一種清晰而易用的文本標記格式,但它的弱點就是當有大量數據需要交換,而程序內部處理部分又非常少時,會導致XML文檔非常大,這樣過大的空間占用意味著更大的處理代價;
2.由于本文壓縮算法多年來一直是大量研究項目的課題,目前已經非常成熟。這種類型的算法都能方便的將XML進行壓縮,但將XML文本作為一般文本文件進行壓縮,這類算法都不大可能改善處理的速度,而且還會增加了解壓后再解析的步驟;
3.我們把XML文檔用于索引結構,這樣就不能只保持了XML文檔的結構而無法對XML進行索引搜索。也就排除了一些簡單的XML壓縮算法。
(二)XML壓縮方法
當壓縮文檔時,通常首先考慮常用的壓縮算法,如:Lempel-Ziv和Huffman,以及在它們上面實現變化的一些常用實用程序。在類Unix平臺上通常是gzip;在其它平臺上,zip更為常用,比如:PKZIP、Info-ZIP和WinZip。但這些實用程序實際上意在充分地減少XML文件的大小。但是,都沒有保持了XML文檔的結構,或是無法對XML文檔進行索引。這樣本文選擇使用BWT壓縮算法而不是順序Lempel-Ziv算法。
(三)BWT數據壓縮
利用BWT壓縮算法,我們先把字符文本進行轉換,然后進行壓縮,這樣就解決了XML文檔過大的弊端。而且BWT壓縮算法要比順序LZ算法,解壓時速度有所提高。BWT算法的具體介紹我們在第5章進行講解。
三、系統設計
(一)XML文件整體輸出
首先,我們先不考慮XML文件的結構,這樣把XML數據文件提交給程序,會按照普通文本文件的方式進行處理。程序先讀取整個文件的內容,之后將它們作為一個字符串,進行后綴數組排序,然后BWT轉換。但是這樣的結果并不如意,有以下兩個缺點:
1.程序執行的效率不高,文件內容如過大,導致整體的速度下降;
2.不便于查找,整體進行排序換轉后打亂了文件結構,不能成為索引;
(二)以XML文件結構進行輸出
由于不能破壞XML文件的結構,只能按照XML現有的標簽內容進行。這樣我們就引入了XML解析器,它可以分析出XML文件的結果和具體內容。先用解析器解析XML文件,我們就方便的判斷出,什么是標簽,什么是數據。把每個標簽或者數據,單獨進行排序轉換。
具體過程:
1.XML解析器讀取分析XML文件;
2.建立一個空的XML文件,進行添加排序轉換后的數據;
3.如分析出標簽開始,則提取此標簽,對其進行排序轉換,把結果插入新的XML文件;并記住此標簽的級別,用于插入下級標簽時使用;
4.如分析出數據,則對數據進行排序轉換,并直接把新數據插入包含它的標簽中;
5.如分析出標簽結束,則關閉此級標簽,結束數據轉換;并記錄新的標簽級別,用于插入平級標簽時使用。
參考文獻:
[1]Donald Knuth.Art of Computer Programming[M].2002,Volume,3
論文摘 要 智能交通系統 (ITS) 是集成于信息技術、傳輸技術、電子技術、及計算機處理技術等多種類電子工程技術,而建立起的實時、高效、準確的綜合運輸和管理體系。其中,數據壓縮和數據融合技術使得ITS技術更具有現實意義。本文基于智能交通系統中信息的特征,探討了數據壓縮和數據融合技術涉及的關鍵技術及要求,分析了技術應用及現實突破。
1 ITS信息及特征分析
1.1 智能交通信息(ITS)
交通系統由包括4個基本要素:人(交通出行者、駕駛員和管理者)、物(貨物)、各類交通工具和相應的交通設施構成。交通信息是指所有與交通系統的四大要素相關聯的信息,是ATMS的關鍵基礎。面向ATMS的基礎交通信息主要是指與交通運行狀態和交通管理有關的交通信息,是交通信息中最直接、最基礎的信息?;A交通信息包括基礎交通地理信息、交通實時狀態信息、交通控制和管理信息、交通政策法規信息、公共交通信息。
1.2 基礎交通信息的屬性特征
基礎交通信息是一種在大范圍內、全方位發揮作用的,實時、準確、高效的綜合運輸和管理系統,其應具有以下一些基本屬性特征:1)準確性;2)及時性;3)共享性;4)信息的采集具有實時性和動態性;5)具有海量信息特征;6)增值性。
2 數據壓縮處理技術
交通信息一方面時采集到的信息煩雜多樣,要想利用這些不同類別的信息,需采用不同的處理方法;另一方面,交通信息的一個顯著特征是它的空間性和隨機性,因此對它的研究分析需要建立在廣泛統計的基礎上,應用各類信息處理技術和統計分析方法來探索它的規律性。
所謂多媒體技術就是能對多種載體(媒體)上的信息和多種存儲(媒質)上的信息進行處理的技術,特點主要表現在它的綜合性和交互性。交通信息是屬于多媒體信息范疇。若要實時的綜合處理聲音、圖像、視頻、文字等多媒體信息,其數據量是非常大的。要傳輸或存儲這樣大的數據量是非常困難的,必須對其進行壓縮編碼,在滿足實際需要的前提下,盡量減少要傳輸或存儲的數據量。
數據壓縮主要依靠信源編碼技術。一般的,圖像壓縮技術可分為兩大類:無損壓縮和有損壓縮技術。在多媒體應用中常用的壓縮方法有PCM(脈沖編碼調制)、預測編碼、變換編碼、插值和外推法、統計編碼、矢量量化和子帶編碼等;混合編碼是近年來廣泛采用的方法。新一代的數據壓縮方法,如基于模型的壓縮方法、分形壓縮和小波變換方法等也已經接近實用化水平。
3 信息融合技術
信息融合技術在單純數據采集融合(即一次融合)階段稱為數據融合,是研究多種信息的獲取、傳輸與處理的基本方法、技術、手段以及信息的表示、內在聯系和運動規律的一門技術。融合是指采集并集成各種信息源、多媒體和多格式信息,從而生成完整、準確、及時和有效的綜合信息,它比直接從各信息源得到的信息更簡潔、更少冗余、更有用途。
先進的交通管理系統(ATMS)是一個典型的多傳感器系統,信息融合技術給交通信息加工和處理提供了一種很好的方法,信息融合技術的最大優勢在于它能合理協調多源數據,充分綜合有用信息,提高在多變環境中正確決策的能力。
在信息融合領域使用的主要數學工具或方法有概率論、推理網絡、模糊理論和神經網絡等,其中使用較多的是概率論、模糊理論、推理網絡。當然,除了這幾種常用的方法之外,還有其他很多解決途徑。
3.1 概率論
在融合技術中最早應用的就是概率論。在一個公共空間根據概率或似然函數對輸入數據建模,在一定的先驗概率情況下,根據貝葉斯規則合并這些概率以獲得每個輸出假設的概率,這樣可以處理不確定性問題。貝葉斯方法的主要難點在于對概率分布的描述,特別是當數據是由低檔傳感器給出時,就顯得更為困難。另外,在進行計算的時候,常常簡單地假定信息源是獨立的,這個假設在大多數情況下非常受限制。卡爾曼濾波方法則根據早先估計和最新觀測,遞推地提供對觀測特性的估計。另外,概率論和模糊集理論的綜合應用給解決多源數據的融合問題提供了工具。
3.2 模糊理論
模糊集理論是基于分類的局部理論,因此,從產生起就有許多模糊分類技術得以發展。隸屬函數可以表達詞語的意思,這在數字表達和符號表達之間建立了一個便利的交互接口。在信息融合的應用中主要是通過與特征相連的規則對專家知識進行建模。另外,可以采用模糊理論來對數字化信息進行嚴格地、折衷或是寬松地建模。模糊理論的另一個方面是可以處理非精確描述問題,還能夠自適應地歸并信息。對估計過程的模糊拓展可以解決信息或決策沖突問題,應用于傳感器融合、專家意見綜合以及數據庫融合,特別是在信息很少,又只是定性信息的情況下效果較好。
3.3 推理網絡
推理網絡的構建和應用有著很長的歷史,可以追溯到1913年由一位名叫John H W ig-more的美國學者所做的研究工作。近來,許多對于分析復雜推理網絡的理論往往基于貝葉斯規則的推論,并且都被歸類于貝葉斯網絡。目前,大多數貝葉斯網絡的研究都包括了對于概率有效傳播的算法拓展,同時它在整個網絡中也充當了新證據的角色。同時貝葉斯網絡在許多A1任務里都己作為對于不確定推理的標準化有效方法。貝葉斯網絡的優點是簡潔、易于處理相關事件。缺點是不能區分不知道和不確定事件,并且要求處理的對象具有相關性。在實際運用中一般不知道先驗概率,當假定的先驗概率與實際相矛盾時,推理結果很差,特別是在處理多假設和多條件問題時顯得相當復雜。
參考文獻
[1]楊兆升.基礎交通信息融合技術及其應用[M].北京:中國鐵道出版社,2005.
[2]史其信,陸化普.中國 ITS 發展戰略構想[J].公路交通科技,1998,3.
關鍵詞:多媒體通信;IP;視頻會議
Abstract: According to the main features of the IP network, focusing on network bandwidth, compression technology, multicast technology, transport protocol, QOS, and other aspects of the five IP-based video conferencing system, building a network of technical requirements.
Key words: multi-media communication; IP; video conferencing
1 前言
隨著多媒體計算機技術和通信技術的發展,產生了一種新的技術——多媒體通信技術,它是多媒體、通信、計算機和網絡等相互滲透和發展的產物,兼收了計算機的交互性、多媒體的復合性、通信的分布性以及電視的真實性等特點,具有明顯的優越性。目前,如何在IP網絡中更好、更快地實現視頻、音頻的傳送已成為當今的研究熱點之一。
2 基于IP網絡構建視頻會議系統的技術要求
隨著IP網絡的速率越來越高,從窄帶走向寬帶,承載業務從非實時走向實時,IP技術已成為實現視頻、音頻、數據等綜合業務的最佳選擇。在IP網絡上建立視頻會議系統需要多種技術支持,是比較復雜、完整的多媒體應用系統。
2.1 要有足夠高的帶寬
要傳送視頻,必須要有足夠的網絡帶寬,就像大車要有足夠寬的馬路才能通行一樣,否則,視頻數據無法通過網絡。以一幀1024×768像素的圖像為例,如果用12bit表示每個像素,則共需要9.4Mb,如果按照25幀/秒的傳輸速率,則1秒內需要傳輸的數據量就是235Mb。在現有的網絡條件下,傳輸這么大的數據是無法接受的。
2.2 要有好的壓縮技術
只有采用高壓縮比的壓縮算法,有效地降低數據量,才能使視頻、音頻數據在IP網上傳輸成為可能。例如:在H.323會議系統中,圖像編碼主要采用H.261和H.263標準,支持CIF、QCIF的分辨率,而正在完善之中的H.264是比H.263和MPEG-IV壓縮比更高的標準,節約了50%的編碼率,而且對網絡傳輸具有更好的支持,可獲得HDTV、DVD的圖像質量。
2.3 要有基于IP網絡的多播技術
多播是一種多地址廣播,發送與接收是一對多的關系。在傳輸過程中,發送端只需發送一次數據包,位于多播組內的各個用戶就可以共享這一數據包。在視頻會議系統應用中,將一個節點信號傳送到各個節點時,無論是重復采用點對點通信,還是采用廣播的方式,都會嚴重浪費網絡帶寬,而多播技術將數據傳送分布到網絡節點中,減少了網絡中的數據總量。
轉貼于 2.4 要有相適應的傳輸協議
TCP、UDP協議均不能很好地支持視頻會議系統,這就需要與之相適應的協議,如RTP、RTCP、RSVP等。RTP運行在UDP之上,音頻、視頻等數據被封裝在RTP數據包中,每個RTP數據包被封裝在UDP包中,然后再封裝到IP包中進行傳輸。在底層網絡支持多播的情況下,RTP還可以使用多播向多個目的端點發送數據。RTCP是RTP的控制協議,負責反饋控制、檢測QoS和傳遞相關信息,對RTP的數據收發做相應調整,使之最大限度地利用網絡資源。
2.5 要提供服務質量保證
網絡服務質量是網絡與用戶之間以及網絡上互相通信的用戶之間關于信息傳輸與共享的質量約定。第一,在任何網絡中,時延總是存在的。視頻會議系統具有較高的實時性和可靠性要求,為了獲得各會場的真實的現場感,音頻、視頻的時延都要小于0.25s,最大時延抖動應小于10ms。其次,在視頻會議系統中,還要求唇音同步,只有達到時間上的同步,才能自然有效地表達關于會場的完整信息。第三,允許一定的丟包率。因為人的感知能力有限,在一個視頻會議系統中,個別分組丟失,人眼是感覺不到的,因此可以允許一定的傳輸誤碼,丟包率應控制在人能接受的范圍內。
3 基于IP網絡構建視頻會議系統的協議
基于IP網絡構建視頻會議系統的標準主要有:H.323和SIP。
H.323沿用了傳統的電話信令模式,比較成熟,已經出現了很多產品,形成了比較成熟的應用體系和市場體系。SIP協議將音、視頻傳輸作為Internet上的一個應用,增加了信令和QoS要求,借鑒了其它Internet標準和協議的設計思想,遵循簡練、開放、兼容和可擴展等原則,比較簡單,但其推出時間不長,協議并不是很成熟,應用也不是很多。
4 結束語
隨著網絡、多媒體、通信技術的飛速發展和性能的提升,基于IP網絡構建視頻會議系統技術會不斷被發展和完善,必將以其獨特的優勢廣泛應用到Internet、Extranet、Intranet上,為政府機關、商業集團、科研院所、醫療機構及普通個人等進行異地交流提供方便條件,成為工作、學習、生活中不可或缺的工具。
參考文獻
[1] 張智江,張云勇,劉韻潔.SIP協議及其應用[M].北京:電子工業出版社,2006.
[2] 沈鑫剡,等.多媒體傳輸網絡與VoIP系統設計[M].北京:人民郵電出版社,2005.
[3] Douglas E.Comer. Internetworking With TCP/IP Vol I:Principles,Protocols,and Architectures Fourth Edition[M].北京:電子工業出版社,2004.02.
【關鍵詞】數字音視頻 MXF DV MP4
數字音頻碼流的分割及合并技術能夠快速對音視頻數據進行刪除、替換以及增加等修改操作。在對數字高清視頻素材進行編輯時,能夠使各類高清素材完成精確幀定位并進行剪、接等操作;能夠確保素材在分割后,擁有獨立的組織結構,以正確的格式進行播放并且支持再次編輯;能夠使多個素材片段實現無縫拼接。這就使得對數據碼流的分割以及合并技術的研究顯得尤為重要,因為數據碼流的分割與合并技術直接關系到編輯的效果。
1 數字音頻編碼標準
目前在國際上,數字音視頻編碼壓縮標準主要以MPEG和H.26X標準為主。其中,MPEG主要是針對MPEG系統、視頻、音頻制定的標準格式,又可分為:MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21;而H.26X主要是針對多媒體通信視頻和音頻編碼制定的標準格式。
隨著數字音視頻編碼技術的不斷完善,由 SMPTE制定的DV和MXF格式,已成為當今高清電影電視、電子新聞節目制作的主流。其中,DV是一種專業的數字音視頻采集設備、數碼影像規格,它廣泛應用在電視電影節目制作、電子新聞采集等專業領域。MXF是一種通用的媒體容器格式,它可以在不同的協議和操作系統下工作,它能夠將各類壓縮方式的素材進行靈活封裝。目前,音視頻素材的封裝主要以P2系列音視頻標準格式為主。它能夠直接采用MXF文件格式將音視頻素材記錄到P2卡上,提高了音視頻編輯的速度和效率,P2已經成為高清數字音視頻編緝的主要格式。本文就是在P2格式環境下,對高、低碼率兩類素材的分割合并技術進行研究。
2 分割及合并技術分析
要想準確順利完成對數字音頻視頻文件進行分割及合并,必須在了解MXF文件結構、音視頻數據組織、封裝形式、素材數據等信息前提下,對文件頭部重要元素進行分析。P2系列音視頻素材MXF文件結構主要由頭部Partition Pack標識的 Header Partition和Body Partition,以及Footer Partition所組成。由于Header Partition中涉及頭部元素數據與索引表,Header Partition緊跟Partition Pack標識,Footer Partition又對索引表進行了拷貝;Body Partition中涉及音視頻素材實質數據,因此,P2系列音視頻素材MXF文件中的數據都將以KLV編碼組織。如下圖1所示:
為了將音視頻數據放入通用媒體容器中,則利用Body Partition Pack后的Essence Container作為能夠承受裝載的容器,并采用Clip Wrapping封裝映射方式對音視頻數據幀進行定位分割及合并操作。因此,先對文件進行讀取,查看是否屬于MXF文件;其次,當文件為多個Body Partition時,則從尾讀取至Partition Pack起點位置,當文件為單個時,則依次序讀取,并對Header Partition進行依次序分析,并確定Essence Container的位置;再次,根據Header Metadata給出的信息,對格式、生成方式、素材輸入時間等信息進行音視頻確認;最后,對音視頻數據幀進行定位分割及合并操作。由于數字音頻數據編碼方式為KLV組織,使素材檢索定位效率獲得了提高。在進行Clip Wrapping封裝時,視頻所有幀數依次一幀緊接一幀靠在一起作為Picture Item放置到通用媒體容器中。對幀的定位順序為:Body Partition、Picture Item的位置,以及視頻幀在Picture Item的位置,并取出。而音頻數據與視頻數據讀取的方式相類似,由于數據重要放置在Sound Item中,因此,讀取的時候,只需要一次讀取1s或Ns的采樣數據,封裝時,因Sound Item中的數據量不夠,則需要從多個Sound Item中讀取音頻數據進行分割合并,組成一個較大的數據緩沖,從而實現數字音頻碼流的無縫拼接。
視頻壓縮編碼技術有幀內壓縮( Intra--frame ) 和幀間壓縮(Inter-frame)兩種, 音視頻素材在編輯過程中采用哪種壓縮方式決定了對素材進行分割與合并的難度。幀內壓縮一般是有損壓縮,針對每一幀圖像進行壓縮,幀與幀之間沒有相互關聯,在壓縮以后仍然可以以幀為單位進行編輯,因此,在DV格式等非線性編輯領域常常會使這種壓縮方式。但是這種壓縮比率一般不高,為了要達到更高的壓縮比例就得使用幀間壓縮方式。幀間壓縮一般是無損壓縮,它通過比較相鄰兩幀之間的差異,在記錄時僅僅記錄本幀與相鄰幀的差值,這種壓縮方式減少了數據量,大大提高了壓縮的比率。在實際應用中,兩種壓縮方式往往同時使用,MPEG-2編碼就同時具有幀內壓縮與幀間壓縮兩種方式。
3 數字音視頻壓縮技術的實現
3.1 幀內壓縮方式下的分割及合并
利用幀內壓縮方式下的分割及合并技術,只需要對分割文件偏移位置進行確認后,進行重新編寫新的文件,所修改分割合并后的新音視頻素材文件就能夠正常進行播放。下面主要針對DV、AVCI兩類采用幀內壓縮方式的素材進行分析。其具體分割流程如圖2所示:
合并的實現過程與分割過程基本相同,素材的合并主要是針對格式以及參數相同的兩個素材而言。
3.2 幀間壓縮方式下的分割及合并
幀間壓縮方式具有壓縮效率高、速度快等優點,但對素材的分割與合并不能簡單的找到相應幀的位置進行操作。我們將采用幀類型變換的方法對幀間壓縮的素材進行分割。以MPEG-4格式為例,首先把MP4文件分解成視頻數據MPEG-4 video ES和 音頻數據MPEG-4 audioAAC。由于MPEG-4 文件中沒有各幀對應的時碼信息,沒有分割MXF文件時直接供參考幀的絕對時碼,因此需先依據原素材文件的開始時碼即入點和出點來計算出對應的幀序號,然后根據幀頭分別找到入點和出點對應的幀偏移。合并技術的重點在于實現各個素材片段的重排序以及無縫合并,實現音視頻重同步效果。
綜上所述,數字音視頻壓縮技術主要是為了能夠在原音視頻素材上,有效縮短任務時間快速對幀進行定位訪問,并根據幀的位置,實現數字音視頻素材編輯的無縫拼接。以確保數字音視頻素材在經過壓縮以后,依然具有完整性、可再編輯性。目前針對多種應用環境下的音視頻碼流素材的分割、合并技術的研究也正在進行,對數字音視頻的高效長遠的發展有著很大的意義。
參考文獻
[1] 龔聲蓉,王朝暉.結合視頻分割的形狀編碼算法[A].蘇州市自然科學優秀學術論文匯編,2010.
[2] 張曉萌,劉云,陳潛.嵌入式音視頻碼流合并系統的設計與實現[J].計算機應用,2011.
[3]張文豐.MPEG-2音視頻碼流合成與轉換技術的研究和實現[D].電子科技大學,2006.
由於在現今資訊流通普遍的社會中,影像的需求量越來越大,影像的數位化是必然的趨勢。然而在數位化過的影像所占的資料量又相當龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯的表現,為其尚未有一標準的格式,故在應用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關系。故以此篇文章介紹小波(WAVELET)轉換的歷史淵源。小波轉換的基礎原理。現今的發展對印刷業界的沖擊。影像壓縮的未來的發展。
壹、前言
由於科技日新月異,印刷已由傳統印刷走向數位印刷。在數位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當的費時,現今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經地義的事,但是用網路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數學家與資訊理論學者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現鋸齒狀的現象。皆會造成印刷輸出的問題。影像壓縮技術是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉路轉,科學家便將注意力移轉到WAVELET轉換法,結果不但發現了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發展出來的數學理論。小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數學理論早在1960年代中葉就有人提出了,而到現在才有人將其應用於實際上,其理論仍有相當大的發展空間,而其實際運用也屬剛起步,其後續發展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學公式。傅利葉方程式在十九世紀初期由JosephFourier(1768-1830)所提出,為現代信號分析奠定了基礎。在十九到二十世紀的基礎數學研究領域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發展出來的數學理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規范正交基。其後1984年,法國地球物理學J.Morlet在分析地震波的局部性質時,發現傳統的傅利葉轉換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學家A.Grossman對Morlet的這種信號根據一個確定函數的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構出具有一定衰減性的光滑函數Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構成L2(R)的規范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構了小波函數的構造及信號按小波轉換的分解及重構。1988年Daubechies建構了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區域中是非零的小波,如此,小波分析的系統理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統合了此三項技術。小波轉換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應用於編碼、解碼、檢測邊緣、壓縮數據,及將非線性問題線性化。良好的分析局部的時間區域與頻率區域的信號,彌補傅利葉轉換中的缺失,也因此小波轉換被譽為數學顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經由數學公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關)。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經由取舍資料而達到壓縮目地的作法,是近代數位影像編碼技術的一項突破。即是WAVELET的概念引入編碼技術中。
WAVELET轉換在數位影像轉換技術上算是新秀,然而在太空科技早已行之有年,像探測衛星和哈柏望遠鏡傳輸影像回地球,和醫學上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現的效果。
以往lossless的編碼法只著重壓縮演算法的表現,將數位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數位化的影像資料轉換成利於編碼的資料型態,控制解碼後影像的品質,選擇適當的編碼法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉換DCT轉換量化器編碼器編碼結束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉換可表現在影像上的。
(二)其轉換的系數是可以量化的。
(三)其量化的系數是可以用函數編碼的。
四、現有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內插量化,對編碼的架構有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內插。
(五)ArithmeticCoder(數學公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發展趨勢
一、在其結構上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數學編碼器,使資料能在數學公式和電腦的位元之間轉換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現今已有由中研院委托國內學術單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應用於實務上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數位化。
2.如何將數位化的影像資料轉換成利於編碼的資料型態。
3.如何控制解碼影像的品質。
4.如何選擇適當的編碼法。
5.人的視覺系統對影像的反應機制。
小波分析,無論是作為數學理論的連續小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發展,他保留了傅氏理論的優點,又能克服其不足之處。
陸、在印刷輸出的應用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續發展潛力無窮,尤其在網路出版方面,其利用價值更高,WAVELET的出現就猶如當時的JPEG出現,在影像的領域中掀起一股旋風,但是WAVELET卻有JPEG沒有的優點,JPEG乃是失真壓縮,且解碼後復原程度有限,能在網路應用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數位印刷上。等到WAVELET的應用成熟,再發展其適用的RIP,又是一段時間以後的事了。
在網路出版上已經有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網路上大量使用,應該是未來的趨勢。對於網路出版應該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網路的使用費用,增加企業的利潤,由於傳版的時間減少,也使印刷品在當地印刷的可能性增高,減少運費,減少開支,提高時效性,創造新的商機。
柒、結論
WAVELET的理論并不是相當完備,但是據現有的研究報告顯現,到普及應用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學領域上,均有其應用價值。國內已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現。這也顯示國內的研究速度,遠落在外國的後面,國外已成立不少相關的網站,國內僅有少數的相關論文。如此一來國內要使這種壓縮模式普及還有的等。正式使用於印刷業更是要相當時間。不過對於網路出版仍是有相當大的契機,國內仍是可以朝這一方面發展的。站在一個使用其成果的角度,印刷業界也許并不需要去了解其高深的數理理論。但是在運用上,為了要使用方便,和預估其發展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據,也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(二)圖檔壓縮續篇,旗標出版有限公司。
5.盧永成,民八十七年,使用小波轉換及其在影像與視訊編碼之應用,私立中原大學電機工程學系碩士學位論文。
JPEG2000是新一代的靜態圖像編碼國際標準,與已有的JPEG標準相比,它可以提供更好的圖像質量和更高的壓縮率,但其計算的復雜度也遠高于JPEG算法。一般在處理JPEG 2000圖像時,若欲將其圖像尺寸縮小,首先需由JPEG 2000解碼器處理,將JPEG 2000圖像解碼到空間域圖像后,在空間域里將圖像縮小至所需尺寸后,再經JPEG 2000編碼器將圖像作編碼,最后得到尺寸縮小后的壓縮圖像。但是由于在空間域里使用圖像大小轉換方法來縮小JPEG 2000圖像,需要大量的計算量、繁雜的處理過程、以及占用大量的存儲空間。為了加快圖像尺寸轉換處理速度、降低計算復雜度、以及有效降低存儲空間占用,本論文提出一個快速的JPEG 2000圖像尺寸縮小轉換算法。流程如圖1。
在我們的快速JPEG 2000圖像尺寸縮小轉換方法中,首先將原始JPEG 2000圖像經EBCOT解碼以及反量化步驟解出圖像的頻率域編碼信息后,再透過頻率域圖像尺寸縮小轉換方法,直接在頻率域里縮小圖像尺寸,最后再通過量化與EBCOT編碼等步驟,將圖像尺寸縮小后的圖像頻率域編碼信息編成JPEG 2000圖像。
本文所提的JPEG 2000圖像尺寸縮小轉換方法與空間域圖像大小轉換方法相比,所提的方法省掉反向小波轉換、反向色彩轉換、后置處理、前置處理、正向色彩轉換、以及正向小波轉換等六個步驟。由于所提的方法不需將頻率域編碼信息轉成空間域圖像,因此本論文所提的方法除了可更快速的轉換圖像大小外,也可省下存放空間域圖像內容所需的存儲空間以及減少所需的計算量。
1 簡化JPEG 2000壓縮與解壓縮流程
在快速JPEG 2000圖像尺寸縮小轉換方法中,保留了EBCOT解碼、反量化、量化與EBCOT編碼等四個部分,主要原因說明如下:
1.1 EBCOT編/解碼 JPEG 2000編碼后的圖像會儲存成封包的格式,但封包并非以子頻帶為單位儲存,所以要取得各子頻帶的內容,必須先經過EBCOT解碼才行。再者本文的方法有可能需要對子頻帶再進行小波轉換,因此EBCOT編/解碼過程不可省略。
1.2 量化與反量化 保留量化與反量化步驟的主要原因在于圖像經由正向小波轉換后,會產生不同大小的子頻帶頻率信息,不同子頻帶頻率信息使用不同的量化步長值進行量化。
子頻帶與量化步長值這兩者有相對應關系,換句話說以具有7個子頻帶的JPEG 2000圖像而言,必須要有7個相對應的量化步長值。而子頻帶與量化步長值所產生的數目與小波轉換的層數有關,對于一個經過m層小波轉換的影像,所具有的子頻帶數目Nsubbands計算公式為:Nsubbands=3×m+1,圖2所示為圖像經由二次小波轉換后所產生的七個不同的子頻帶。
每個子頻帶的量化步長值都是由一組獨立的控制參數(ε,μ)決定,該組控制參數必須記錄于JPEG 2000碼流頭部,供譯碼端還原量化步長值使用。圖3所示為一張圖像經過三次小波轉換后所產生的頻率域情況。
本文所提的頻率域圖像尺寸縮小方法會改變原本圖像的小波轉換層數,進而影響到量化步長值與子頻帶的對應關系。當使用不同小波轉換層數時,每個子頻帶的量化步長值會不同。所以,當圖像在進行尺寸縮小前,先使用原本JPEG 2000圖像的量化步長值對圖像進行反量化,還原頻率域信息,當圖像尺寸已調整縮小后,再用新的量化步長值來量化頻率域信息,即可解決量化步長值與子頻帶不一致的問題。
在我們所提的方法中,分別會遇到小波層數足夠與小波層數不足的情況。假設一張JPEG 2000圖像小波層數為m層,欲要將圖像尺寸縮小為原來的(1/2n×1/2n)大小時,假如n
若n>=m發生,也就是小波層數不足。首先經EBCOT解碼后,產生不同的子頻帶信息。針對不同的子頻帶信息使用反量化,接著進行圖像縮小的工作,將不需要的外頻信息去除,保留的頻率信息因小波層數不足(小波層數需為1層以上),要對保留的頻率信息再進行小波轉換。產生出來的小波頻率域尺寸大小超過欲轉換尺寸,可將外頻的小波頻率信息去除,保留LL子頻帶。此時圖像大小雖已符合轉換所需大小,但JPEG 2000規定圖像至少要有一層小波轉換,所以必須再做一次小波轉換,得到一張小波轉換層數為1的JPEG 2000圖像,最后再經量化與EBCOT編碼,得到尺寸縮小后的JPEG 2000圖像。
2 頻率域圖像尺寸縮小轉換方法
圖1中間的頻率域圖像尺寸縮小轉換方法主要工作包括縮小頻率域圖像尺寸與修改JPEG 2000圖像碼流主標頭相關參數等步驟,詳細步驟如下:
2.1 括縮小頻率域圖像尺寸
①小波轉換層數足夠的作法。假設當圖像的小波層數為m層,欲將圖像尺寸縮小為(1/2n×1/2n)大小時,若n
首先使用EBCOT解出頻率域信息,再對需保留的頻率域信息作反量化動作,接著將整張圖像的尺寸縮小,并且丟棄不需要的外頻頻率信息,最后將所保留的頻率域信息再重新經過量化與EBCOT編碼,即可得到圖像尺寸縮小后的JPEG 2000圖像。
②小波轉換層數不足的作法。假設當圖像的小波層數為m層時,欲將圖像尺寸縮小為(1/2n×1/2n)大小時,若n>=m,就是小波層數不足,則除了丟棄m個外層的中高頻信息外,還需要將原來最內層的低頻信息,進行(n-m)+1次小波轉換,再將所產生的(n-m)層的中高頻信息丟棄。由于以上的(n-m)次小波轉換后的中高頻信息最終將被丟棄,因此在進行以上小波轉換時可直接省略許多計算工作,不必進行完整的小波轉換。此法為本文提出的快速小波轉換方法。
2.2 修改JPEG 2000圖像碼流主標頭相關參數 JPEG 2000圖像碼流主標頭記錄原始圖像大小、塊狀(tile)大小、小波層數、各子頻帶的量化步階值參數(ε和μ)等數據信息。在我們所提方法中,并沒有將圖像解回空間域,而是在頻率域信息縮小圖像尺寸后,直接進行量化和EBCOT編碼,產生新的JPEG 2000圖像。新的JPEG 2000圖像碼流主標頭數據無法像空間域轉換方法由JPEG 2000壓縮方式設定,而必須自行修改JPEG 2000圖像碼流主標頭內的相關參數。
3 小結
JPEG 2000具有的多種特性使其有著廣泛的應用前景。目前許多圖形圖像公司如Pegasus,Aware等在開發的圖像軟件中集成了JPEG 2000圖像壓縮技術;有的公司如ImagePower等已開發出JPEG 2000的DSP芯片。JPEG 2000將取代JPEG在圖像壓縮領域發揮重要作用。本論文提出一個新的快速圖像壓縮方法,可 大幅降低使用空間域轉換時的處理時間,以及所需存儲空間,但是本文所提方法只針對靜態圖像實現固定大小的縮小轉換,無法對圖像作任意大小轉換,對圖像作任意大小轉換是一個很好的發展方向,需作進一步研究。
參考文獻:
[1]杜偉娜,孫軍,倪強.基于JPEG2000的高效率控制算法[J].上海交通大學學報,2006,40(1):16-19.
查看更多《信息技術》雜志社信息請點擊: 《信息技術》編輯部
基金項目
(1)基于c++ builder的共焦顯微鏡三維重建方法 楊召雷 張運波 董洪波
(4)m—link在通信系統仿真中的設計與實現 姚云龍 周俊 劉強
(8)基于嵌入式的無線煤炭自燃預警系統 劉德文 杜宇人
(11)tts語音單元的無損壓縮與按需解壓縮技術 卡斯木江·卡迪爾 古麗娜爾·艾力 艾斯卡爾·艾木都拉
無
(14)2012年中國國際信息通信展覽會開幕 無
基金項目
(15)低載荷工業機器人運動學分析與仿真 陳蓓玉 胡凱 楊樂
(19)基于zigbee無線傳感網絡監測系統的實現 楊俊 阮超 陳?,?付紅橋
(23)endnote x5軟件在論文撰寫過程中的應用 程宏輝 程筱農 奚和平 黃新
(26)一種近距離無線傳感器系統的設計 葉天鳳 胡長暉 葉夢君 萬里光
(29)sakai網絡教學平臺統一身份認證中心的實現 柯水洲 馬雪梅 王新舸 鄒剛
(33)增益連續可調寬帶前置放大電路設計與實現 汪俊杰 蓋建新 劉旭 程爽
(37)actionscript3.0垃圾回收機制及優化策略 李智勇
(40)基于彩信的遠程控制寵物籠系統的研制 楊樂 高超
(42)spring mvc技術分析及在實踐教學系統中的應用 符紅霞
(47)支持向量機在廣義預測控制中的應用 張偉 賈蓉
(50)測控信息技術領域提高學生實踐創新能力的方法 王可寧 劉纏牢 王偉 張雄星
(53)一種復雜背景下車牌定位算法 趙大偉 陳剛
研究與探討
(58)基于spce061a的語音手動雙控制開關的設計 李建新 張肖飛 徐麗妍
(62)基于bp神經網絡的鉆井復雜情況和事故診斷 崔猛 汪海閣 李洪 紀國棟 于洋
無
(65)第九屆通信企業管理現代化創新成果審定會開幕 無
研究與探討
(66)一種基于單攝像頭的虛擬鍵盤 楊騁
(68)基于橢圓曲線的充值卡加密 孫傳亮 周海港
(72)基于ccd和光電編碼器的差速整定方法研究 李增彥 張迪洲 張男
(77)嵌入式軟件仿真測試平臺開發 林丹丹
(80)基于anybus-s pn io模塊的profinet遠程i/o設計 楊明 王永剛 張陸毅
(85)采用mel倒譜參數的咳嗽聲識別方法 尹永 莫鴻強
(92)模板匹配算法的兩種實現方法比較 謝方方 楊文飛 陳靜 李芳 于越
(96)基于msp430的低頻信號分析儀設計 張君 李金龍 郭建強 楊林曉
(101)基于labview的雙向智能鑰匙充放電測試系統 尹武 張文娟 周繼宇
br> (104)多用途市電負載功率調功電路的設計 姚正武 部紹海 林濤 李樹偉
(107)gps周跳探測與修復方法的比較分析 徐歡 唐亮 都業濤
(112)并行計算技術綜述 王磊
(116)衛星遠程監視及實時故障診斷研究與應用 陳懷木 賈銀山 穆友勝
(121)基于soa的一體化繳費接入管理平臺設計 王樹全 鄒寧峰 金鑫
(125)基于增量式pid控制算法的智能車設計 肖文健 李永科
應用技術
(128)油層保護模糊專家系統的分析與設計 張丹 曹謝東 魏存擋 龐揚
(131)基于multisim10低頻信號源的設計與仿真 蘭羽 周茜
(134)光電池基本特性的測定 趙楠 孫雪萍 李平舟
(137)基于單片機的無視頻報警監測儀設計 李釗
(140)基于hfss的有孔屏蔽體的屏蔽效能分析 陳新平 楊顯清
(144)戰術無線電臺半實物仿真系統設計與實現 張愛民 辛廣輝 鄭振華
(147)基于混合高斯模型與核密度估計的目標檢測 呂游 任政 李向陽 方向忠
(151)基于業務流程的信息化建設與應用 劉光偉
(153)基于國產cpu的嵌入式醫療電子無線網絡設計 裴家俊 張輝 劉蕓 戎蒙恬
(157)利用vba及office自動化技術輔助人事辦公 王晶
(159)數字鐘電路的設計 曹嘯敏
(163)基于電磁傳感器的智能車自主尋跡系統設計 師克 王洪軍 李永科
無
(166)上海市中國軟件名城創建暨軟件產業工作會召開 無
應用技術
(167)異步時鐘亞穩態仿真方法 高文輝 胥志毅 鄔天愷 劉文江 仲景尼
(170)lwip的移植及其在并行系統中的應用 趙虎 黎英 游謙
(173)盲人行走輔助裝置中道路檢測算法的研究 徐姍姍 應捷 宋彥斌
無
(176)尚冰出席第八屆中國信息無障礙論壇開幕式并致辭 無
應用技術
(177)多載波傳輸系統的頻偏及采樣鐘聯合補償算法 李炎 周志平 李鑫
(181)智能小車模糊-pid控制調速系統設計 張家驊 徐連強 吳迎春
無
(183)第九屆海峽兩岸信息產業和技術標準論壇舉行 無
綜述與評論
(184)epc信息管理系統在裝備器材保障中的研究 康帥 高慶 程遠增
(187)基于供應鏈信息共享的備件資源整合研究 黃健 程中華 王亞彬
(190)航空航天偵察情報保障能力綜合評價模型研究 童濤 楊桄 譚海峰 王壽彪 葉怡
(194)裝備保障信息評價研究 趙國存 劉占嶺
無
(f0003)
關鍵詞:KVM-OVER-IP;H.26X;MPEG;RLE(游程編碼)
中圖分類號:TP368 文獻標識碼:A文章編號:1009-3044(2011)31-0000-00
Video Compression in the Network about Management of Server
FENG Zhan, WU Xin-jun
(Jiangnan Institute of Computing Technology, Wuxi 214128, China)
Abstract: the video compression technology in the server management plays a decisive role, this paper first introduced the current main video compression technology development, the application fields and standards, then for low cost, low power consumption demand, and proposes an improved RLE algorithm.
Key words: KVM-OVER-IP; H.26 X; MPEG; RLE(the run-length coding)
隨著服務器管理技術的發展,大部分的廠商都實現了服務器的遠程網絡管理。使用者不必親臨現場便能處理發生的各種問題,極大的提高了服務器管理的效率。在服務器管理的硬件管理方案中KVM-OVER-IP的應用最為廣泛。KVM實現遠程桌面,虛擬設備、遠程安裝OS鏡像等。一般的KVM卡內嵌了瀏覽器,在客戶端通過web網頁直接訪問控制界面。
1 KVM-OVER-IP
在KVM over IP系統中,最大的挑戰來自于視頻信號的壓縮與傳輸。以分辨率1024x768,刷新率75Hz,32位真彩顯示輸出為例,其信號傳輸帶寬高達1.75Gb/sec,遠遠高于局域網及廣域網所能提供的傳輸帶寬。實用的KVM over IP系統需要在局域網中,提供高于1500:1的視頻壓縮比率;在廣域網中,提供高于6000:1的壓縮比率;同時,KVM over IP系統必須在實現高比率視頻壓縮的同時,在客戶端提供足夠清晰的視頻還原。其中,幀間比對與數據壓縮算法通常是各公司的專有技術,也是直 接決定客戶端還原視頻質量的重要因素。
2 目前主流的視頻壓縮算法
在視頻編解碼技術定義方面有兩大標準機構。包括國際電信聯盟 (ITU) 和國際標準化組織 (ISO)。前者已經開發了用于低比特率視頻電話的 H.26x 標準,其中包括 H.261、H.262、H.263 與 H.264;主要針對電信領域的應用,后者主要針對消費類應用,已經針對運動圖像壓縮定義了 MPEG 標準。MPEG 標準包括 MPEG1、MPEG2 與 MPEG4。
圖1說明了視頻編解碼標準的發展歷程。
2.1 H.261
H.261[1]標準是1990年ITU制定的的第一個主流有損視頻壓縮標準,設計的目的是能夠在帶寬為64kbps的倍數的綜合業務數字網(ISDN for Integrated Services Digital Network)上傳輸質量可接受的視頻信號。編碼程序設計的碼率是能夠在40kbps到2Mbps之間工作,能夠對CIF和QCIF分辨率的視頻進行壓縮編碼。
H.261原理是第一步是對采集的顯卡信號使用幀間預測來消除空域冗余,同時使用了運動矢量來進行運動補償。隨后進行變換編碼即采用使離散余弦變換(DCT)來進一步的消除空域的冗余,然后對變換后的系數進行量化,并量化后的變換系數進行Zig-zag掃描來消除時域的冗余,最后使用熵編碼(可以使長度編碼或者是霍夫曼編碼)來消除統計冗余。但是H.261僅僅對視頻的解碼進行了規定,而并沒有定義解碼器的實現,因此在具體實現時,研究者可以針對不同的應用對數據進行不同的預處理從而達到更好的效果,
2.2 MPEG-1
MPEG-1 [2] 是ISO 于1990年開發的第一個視頻和音頻有損壓縮標準。主要應用是數字媒體上動態圖像與音頻的存儲與檢索,如速率為 1.15Mbps、采用 SIF 分辨率(352′240-29.97fps 或者 352′288-25 fps)的VCD。MPEG-1在關鍵技術上做了一些改進,塊方式的運動補償,離散余弦變換,等技術,隨后被Video CD采用為核心技術。 但是其缺點也比較明顯,雖然在速率上可以滿足很多應用,但是壓縮比不夠大,作為實時視頻壓縮,需要的磁盤空間特別大,正是這一點也限制了它的應用。
2.3 MPEG-2
MPEG-2 [3] 是ISO 于1994年制定的,主要針對于高級工業標準的圖像質量以及更高的傳輸率。并且MPEG-2相比MPEG-1提供較廣范圍的壓縮比,已適用于對畫面質量,存儲容量,以及帶寬要求不同的場合。MPEG-2主要用于DVD的標準,還可用于為廣播,有線電視網,電纜網絡以及衛星直播(DirectBroadcastSatellite)提供廣播級的數字視頻。
2.4 H.263
H.263的開發主要是為了實現低碼流的通信。是在H.261的基礎上制定出來的,但實際上這個標準在很多方面做了改進,可用在很寬的碼流范圍。它在許多應用中都可以取代H.261。H.263的編碼算法與H.261基本原理一樣,但做了一些改善和改變,以提高性能和糾錯能力。H.263標準在低碼率下能夠提供比H.261更好的圖像效果,其特點包括以下幾點:
1)H.263中的數據流層次結構的某些部分是可選擇的,使得編解碼可以根據針對實際的應用選擇數據率和糾錯能力;
2)H.263的運動補償使用半像素精度,這與H.261相比提高了壓縮率;
3)H.263采用了基于空域的的幀內預測方法;
4)H.263支持5種分辨率,即包括QCIF,CIF,SQCIF、4CIF,16CIF,其中SQCIF相當于QCIF一半的分辨率,而4CIF和16CIF分別為CIF的4倍和16倍;
5)H.263采用了無限制的運動向量,允許運動矢量指向圖像以外的區域;
6)H.263采用了基于句法的算術編碼模式使用算術編碼代替霍夫曼編碼,可在信噪比和重建圖像質量相同的情況下降低碼;。
7)H.263提高網絡適應性,采用“網絡友好”的結構和語法,加強對誤碼和丟包的處理,提高解碼器的差錯恢復能力。
2.5 MPEG-4
MPEG-4[4] 是1998年11月公布的,MPEG-4標準主要應用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176X144。MPEG-4利用很窄的帶寬,通過幀重建技術,壓縮和傳輸數據,以求以最少的數據獲得最佳的圖像質量,但是其在服務器的領域沒有得到廣泛的應用。
視頻編碼技術最重要的突破是由 ITU 和 ISO/IEC 的聯合視頻小組 (JVT) 開發的H.264/MPEG-4 AVC[5]標準。H.264/AVC[5] 在壓縮效率方面取得了巨大突破,H.264和H.261、H.263一樣,也是采用DCT變換編碼加DPCM的差分編碼,即混合編碼結構。同時,他采用了一些新的更有效率的技術如幀內預測編碼,可變矢量塊大小。多參考幀預測,自適應環路去塊濾波器等。并且其在應用方面有了更大的進步:
1)H.264沒有繁瑣的選項,而是力求簡潔的“回歸基本”,它具有比之前的壓縮標準更好的壓縮性能,又具有適應多種信道的能力。
2)H.264的應用目標廣泛,可滿足各種不同速率、不同場合的視頻應用,具有較好的抗誤碼和抗丟包的處理能力。
3)H.264的基本系統無需使用版權,具有開放的性質,能很好地適應IP和無線網絡的使用,這對目前因特網傳輸多媒體信息、移動網中傳輸寬帶信息等都具有重要意義。
正是由于H.264的種種特點,使得該算法標準一制定出來,便受到了廣泛的應用,其優秀的編解碼能力在視頻通信領域應用的的也越來越多,盡管其復雜性也是之前視頻壓縮算法的數倍,但是集成電路的發展以及SOC技術的革新,這些已經可以得到很好的解決。
隨著視頻壓縮算法的不斷更新,各大服務器廠商的的實現產品也不斷的革新,主要是針對不同的應用場合采用不同的壓縮算法,然后結合所做的硬件部分進行一些改進和優化。
3 改進的RLE(游程)壓縮算法
本論文提出的視頻壓縮算法是一個低代價,低功耗的可行算法,針對某種特定場合所使用的,雖然壓縮視頻的效果有待提高,但是能滿足基本的要求。本文的視頻壓縮是基于一個256M大小的FPGA上實現的,而且在該FPGA上還實現了一個嵌入式軟核,軟核的作用是實現BMC的調試,因此硬件資源有限,該視頻壓縮只能算該FPGA的一個模塊。因此涉及到太多乘法的算法難以實現,考慮選擇RLE游程算法來實現,該算法簡單容易實現,其基本的思想是,利用數據之間的關聯性,而屏幕顯示的數據,以整個像素為單位,關聯性是很強的,對一般常見的屏幕圖像使用RLE(游程編碼)算法進行單幅圖像的壓縮,平均可以獲得30%到50%的壓縮效果,因此使用RLE算法是可行的。以現有的試驗平臺的硬件條件來看,以太網是100Mbps。傳輸的數據占用1/5帶寬,因此傳輸的數據量有限,只能減少傳輸的數據量,降低傳送視頻的圖像數和視頻的壓縮質量從而完成視頻的壓縮,根據人的視覺系統所能接受的范圍,本文以每秒10幅圖像來完成視頻的傳輸,這樣每幅圖像的壓縮數據應該為256KB,而一幅未經任何處理的1280X1024的圖像大小約為4MB,這樣壓縮效果必須達到原來圖像的1/8左右,因此必須對RLE算法進行優化,使得修改后的壓縮算法能夠保證數據的實時性傳輸,
由于視頻壓縮模塊接受的是顯卡輸出的像素數據,是以RGB形式接收的,本文實現的方法是對每個像素的后三位數據進行四舍五入而后丟棄,這樣做得好處有兩方面:
1)可以增強相鄰像素的相關性從而加強壓縮的效率;
2)可以減少傳輸的數據總量;
然后再對得到的數據使用RLE壓縮方法,具體是實現時是以每行的大小來壓縮成一個數據包,然后通過以太網進行傳輸,客戶端進行解壓縮得到源圖像數據。雖然圖像有一定的失真,但是在可以接受的范圍內,通過在FPGA上測試,基本能達到1/10的壓縮率。
這種低功耗,低成本的視頻壓縮系統,適用于小架構的電子產品。例如低精度的小型攝像儀器,監控系統等。
4 結束語
本文首先介紹了目前主流的視頻壓縮算法,以及適用的各種領域,而后提出一種改進的RLE壓縮算法,主要應用在小功耗的壓縮系統的中,雖然壓縮效果不是很好,但是容易實現,而且其優點也是很明顯的。
參考文獻:
[1] ITU-T建議 H.261:,《用于 px64Kbps 音頻/視頻業務的視頻編解碼技術》.
[2] ISO/IEC 11172-2:,《1.5Mbps 數字存儲媒體的動態圖像及相關音頻的編碼》.1993
[3] ISO/IEC 13818-2:,《動態圖像及相關音頻信息的通用編碼:音頻》.1995
[4] SO/IEC 14496-2:,《信息技術――音頻/視頻對象的通用編碼》.2001
[5] Sullivan G,Wiegand T.“視頻壓縮――從概念到 H.264/AVC 標準”[J].IEEE學報,2005(1).