摘要:V4L是Linux針對視頻設備的應用程序接口,V4L2為其升級版本,它修復了第一版的很多設計缺陷。然而它提供的常規(guī)讀寫函數(shù)并不能滿足大數(shù)據(jù)量的高速傳輸,所以將緩存技術引入到視頻采集領域可以提高系統(tǒng)的吞吐量。提出了一種雙幀內存映射視頻采集機制,由于不需要做數(shù)據(jù)拷貝動作,減少了讀/寫時限,因而可以提高視頻采集性能。實驗結果表明,采用雙幀內存映射機制在視頻采集時速度快,效率高,達到了預期的實驗效果。
關鍵詞:V4L2;Linux;視頻采集;內存映射
0 引言
V4L(video for linux)是由Alan Cox開發(fā)的針對視頻設備的應用程序接口(API),開始出現(xiàn)是在Linux 2.1.x版本內核中,可以實現(xiàn)圖像采集、AM/FM廣播和圖像編解碼等功能。然而,由于它在擴展性和靈活性上的缺陷,漸漸被Bill Dirks設計出的V4L的升級版本V4L2所替代,V4L2開始是在Linux 2.5.x版本內核中集成的,在對視頻設備數(shù)據(jù)的讀/寫中,應用程序可以通過read/write方法或者內存映射來獲得位于內核空間的圖像數(shù)據(jù)。 read/write方法是將數(shù)據(jù)在內核空間和用戶空間之間進行拷貝,而內存映射使應用程序可以直接訪問設備內存,減少了從內核態(tài)到用戶態(tài)的數(shù)據(jù)拷貝,因而可以顯著提高系統(tǒng)的吞吐量,下面討論視頻采集中緩存機制的應用和實現(xiàn)。
1 V4L2的視頻采集框架
V4L2采用了分層架構,應用程序接口為上層,而下層則是視頻設備的驅動程序,一般研究領域都是編寫上層的應用程序,通過編程接口來控制視頻設備完成相應的操作和功能。利用V4L2開發(fā)的視頻采集程序具有設備無關性,任何支持V4L2的視頻采集設備都可以移植此類程序,因而也提高了視頻采集程序的可移植性。
當視頻設備連接到主機后,驅動程序會首先注冊一個主設備號為81的字符設備,它是硬件惟一的身份標識。驅動程序利用主設備號來識別硬件,而系統(tǒng)內核則是利用主設備號讓設備與對應的驅動程序相結合,同時加載驅動程序的成員函數(shù)、次設備號以及其他相關信息,使設備可以正常工作。使用表1中的函數(shù)可以訪問 V4L2設備,也可以在應用程序中直接調用。具體功能如表1所示。
其中,ioctl函數(shù)的功能非常強大,它可以管理設備的I/O通道,設置視頻的制式和幀格式,還提供查詢當前設備屬性的功能,主要的ioctl命令如表2所示。
[!--empirenews.page--]
這些函數(shù)原型一般定義在include/linux/videodev2.h或者videodev.h中。
視頻采集的具體過程描述如下:
(1)打開設備。通過open()函數(shù)打開設備文件,返回文件描述符。
(2)初始化設備。首先通過VIDIOC_QUERYCAP查詢設備屬性,判斷該設備是否為一個合法的視頻采集設備,并確定其支持的功能有哪些;然后通過 VIDIOC_S_FMT設置圖像的格式,例如圖像的大小等;通過VIDIOC_REQBUFS和malloc()分別在內核空間和用戶空間分配內存緩沖區(qū);最后通過mmap()函數(shù)進行內存映射。
(3)圖像采集循環(huán)。首先通過VIDIOC_QBUF將空緩沖區(qū)移入待處理隊列,準備接收圖像數(shù)據(jù);然后通過VIDIOC_QBUF將滿緩沖區(qū)移出已處理隊列,進行圖像的顯示和處理;最后通過VIDIOC_STREAMON和VIDIOC_STREAMOFF啟動和停止采集。
(4)關閉設備。通過close()函數(shù)關閉設備文件。
2 雙幀緩存數(shù)據(jù)傳輸
在視頻采集中,首先在內核空間建立2個圖像緩沖區(qū),不斷將采集到的圖像存放到緩沖區(qū)中。當應用程序需要圖像時,驅動程序并不做拷貝操作,而是建立內核緩沖區(qū)到用戶空間的映射,也就是利用mmap()函數(shù),存取其返回的指針,相當于存取內核中的圖像緩沖區(qū)。由于不需要做額外的復制操作,效率大大提高了,圖像采集流程如圖1所示。
具體說明如下:
(1)程序首先使用VIDIOC_REQBUFS向驅動程序請求圖像緩沖區(qū),v412_requestbuffers結構體包含了所要求緩沖區(qū)的類型及數(shù)量,但驅動程序有權決定最后返回的數(shù)量,因此程序仍需要使用系統(tǒng)返回的緩沖區(qū)數(shù)量,在這里程序返回2個緩沖區(qū)。
(2)由于緩沖區(qū)數(shù)量有2個,調用2次mmap()建立起用戶空間和內核空間緩沖區(qū)的對應關系,然后讀取mmap()所返回的指針就相當于讀取圖像緩沖區(qū)。
(3)此時驅動程序仍然不能對圖像緩沖區(qū)做讀取,調用2次VIDIOC_QBUF ioctl將緩沖區(qū)加入到驅動程序內部的采集序列,之后采集的圖像就會被儲存到這些緩沖區(qū)內。
(4)調用VIDIOC_STREAM ioctl后,驅動程序開始采集圖像,并將圖像放置到緩沖區(qū)內。
(5)雖然緩沖區(qū)內已經(jīng)存放有圖像了,但直接去讀取某個緩沖區(qū)還是需要非常小心的,因為緩沖區(qū)仍然在驅動程序的圖像采集序列中,有可能讀取到一半,驅動程序又使用該緩沖區(qū)儲存新的圖像,而圖1中的(5)是最后調用VIDIOC_STREAMOFF,以停止圖像采集,此時驅動程序會自動將所有緩沖區(qū)從圖像采集序列中移除,所以不需要手動調用VIDIOC_DQBUF,接著使用munmap()清除所有的存儲區(qū)映射導致圖像前后不一致。因此要在讀取緩沖區(qū)前,先調用VIDIOC_DQBUG ioctl,通知驅動程序不要使用此緩沖區(qū),在這個階段中,通常是以如圖2所示的順序來讀取每個緩沖區(qū)的。[!--empirenews.page--]
3 實驗結果
當視頻采集程序編制完成后需要以模塊形式插入內核,再通過make modules對模塊進行編譯,未采用雙幀緩存技術的視頻采集幀速為6 f/s,應用本實驗的方法可以達到8.3 f/s,視頻采集結果截圖如圖3所示:
4 結語
視頻采集是目前遠程教學、遠程診斷、視頻監(jiān)控和視頻會議等技術的基礎。在實時性要求越來越高,工作性能越來越突出的今天,采用雙幀緩存映射機制可以在數(shù)據(jù)采集方面實現(xiàn)高速化,滿足一般性應用要求,但是,使用內存映射現(xiàn)在還存在2個限制:一是面向流的設備不能使用內存映射,如串口;二是映射區(qū)域的起始地址和大小都必須是PAGE_SIZE的整數(shù)倍,即內存映射是以PAGE_SIZE為單位進行操作的。這些都是后期研究中需要解決的問題。