當前位置:首頁 > 嵌入式 > 嵌入式分享
[導讀]絕大多數(shù)嵌入式 Linux 軟件開發(fā)人員編寫用戶空間應(yīng)用程序。由于這些應(yīng)用程序特定于某個領(lǐng)域并且非常復雜,因此應(yīng)用程序開發(fā)人員需要一種簡單的機制來驗證其應(yīng)用程序的功能并衡量性能。

絕大多數(shù)嵌入式 Linux 軟件開發(fā)人員編寫用戶空間應(yīng)用程序。由于這些應(yīng)用程序特定于某個領(lǐng)域并且非常復雜,因此應(yīng)用程序開發(fā)人員需要一種簡單的機制來驗證其應(yīng)用程序的功能并衡量性能。

跟蹤點是 LTTng 用戶空間跟蹤庫提供的特定于應(yīng)用程序的檢測點,用于將用戶指定的數(shù)據(jù)捕獲為事件,它可實現(xiàn)此目的。跟蹤點可以通過兩種方式創(chuàng)建:第一種稱為 tracef,是一種非常簡單的方法,可將所有數(shù)據(jù)捕獲為單個事件。第二種允許開發(fā)人員創(chuàng)建自定義事件。雖然后一種機制需要編寫更多代碼,但它也為收集數(shù)據(jù)并將其顯示在 Tracealyzer 中提供了最大的靈活性。

我在這里使用了 tracef 方法,但請注意,這也會捕獲內(nèi)核跟蹤,原因有二。首先,包含內(nèi)核跟蹤通??梢越忉層脩艨臻g事件的時間線。例如,如果我們應(yīng)用程序中的兩個事件之間存在較長的延遲,則內(nèi)核事件應(yīng)該可以顯示導致延遲的原因。其次,從 4.4.2 版開始,Tracealyzer 需要內(nèi)核跟蹤中的一些數(shù)據(jù)才能正確顯示 UST 事件,盡管它不需要是完整的內(nèi)核跟蹤。

Tracealyzer 還可以測量用戶空間應(yīng)用程序的性能。此特定示例使用 Linux usleep 函數(shù)模擬需要一定時間的函數(shù),在函數(shù)調(diào)用之前添加一個跟蹤點,并在之后添加另一個跟蹤點,以測量函數(shù)完成所需的時間。

在實際場景中,開發(fā)人員會確定應(yīng)用程序中需要測量執(zhí)行時間的位置,并在那里添加 tracef 調(diào)用。例如,一個函數(shù)可能有多個實現(xiàn)候選,并且會檢查執(zhí)行時間以找到最快的算法?;蛘咛囟ê瘮?shù)可能很復雜,需要對執(zhí)行進行表征。編譯上述應(yīng)用程序、在目標上啟動 LTTng 會話、捕獲和下載生成的跟蹤數(shù)據(jù)后,在 Tracealyzer 中檢查跟蹤數(shù)據(jù)。

圖 1.放大跟蹤視圖來檢查跟蹤數(shù)據(jù)。

usleep 函數(shù)調(diào)用的執(zhí)行時間可以定義為每對“開始”和“停止”事件之間的時間。在 Tracealyzer 中執(zhí)行此操作的最佳方法是為自定義用戶事件創(chuàng)建間隔。

保存自定義間隔定義后,它將出現(xiàn)在間隔和狀態(tài)機窗口中,并且 Tracealyzer 會在跟蹤視圖中突出顯示它,從而允許生成間隔時序圖。

圖 2. 要繪制間隔時間圖,請在視圖菜單中選擇設(shè)置...。

毫不奇怪,所有間隔執(zhí)行似乎都持續(xù)了大約 25 毫秒,但單擊其中一個數(shù)據(jù)點就會顯示有關(guān)該間隔的有價值的時間信息。

圖 3. 時間信息視圖。

Tracealyzer 顯示每個間隔長度的統(tǒng)計數(shù)據(jù),這與相關(guān)函數(shù)的執(zhí)行時間相對應(yīng)。第二個框顯示我們感興趣的函數(shù)執(zhí)行間隔時間的統(tǒng)計數(shù)據(jù),例如停止事件和下一個啟動事件之間的時間。第三個框顯示每個間隔發(fā)生的頻率,即從啟動到下一個啟動測量的時間。

區(qū)間圖可用于識別感興趣的函數(shù)的任何異常時間,并且選擇詳細信息視圖中的信息可用于收集高級時間統(tǒng)計數(shù)據(jù)。

大多數(shù)嵌入式軟件開發(fā)人員將在基于 Linux 的嵌入式系統(tǒng)上開發(fā)用戶空間應(yīng)用程序。Tracealyzer 與 LTTng 跟蹤點結(jié)合使用,可以成為一種非常有用的工具,用于確定應(yīng)用程序的運行情況、識別任何異常行為并提供高級時序統(tǒng)計數(shù)據(jù)。然后,它可用于進一步排除任何時序問題并提高應(yīng)用程序的性能。

了解編譯器選項對性能的影響

編譯器選項會影響最無害的計算的性能,即使是基本的正弦函數(shù)也是如此。使用 Tracealyzer 可以幫助開發(fā)人員了解這些選項如何影響執(zhí)行更復雜計算的用戶空間應(yīng)用程序的性能。

我已經(jīng)能夠通過計算頻率為 100 Hz、采樣率為 1 kHz 的正弦波的 1000 個點來證明這一點。通過使用“標準”編譯器選項,我們在 Tracealyzer 中查看系統(tǒng)時間時會看到跟蹤中的不連續(xù)性。在將每個樣本打印到文件的代碼片段中添加 printf 調(diào)用不會顯示不連續(xù)性,因為這只是將值打印到文件中,沒有任何時間概念。但是,當將計算出的值輸出到跟蹤文件時,系統(tǒng)時間包含在每個跟蹤值中。

更改編譯器中的選項有助于減少這種不連續(xù)性。標準 CPU(例如 Arm 處理器)的架構(gòu)旨在高效執(zhí)行整數(shù)運算而不是浮點運算,因此編譯器將浮點指令轉(zhuǎn)換為一系列基于整數(shù)的指令。這會導致 CPU 執(zhí)行的指令數(shù)量大幅增加,系統(tǒng)中的另一個任務(wù)有更大的機會搶占正弦波計算。Tracealyzer 中的跟蹤視圖證實了這一點,其中負責正弦波計算的進程確實被其他進程搶占,在最壞的情況下暫停 900 微秒。

圖 4. 使用整數(shù)處理浮點應(yīng)用程序的不連續(xù)性。

為編譯器指定“-mfloat-abi=hard”選項會告訴它使用一組專門為浮點操作設(shè)計的指令。然而,這并沒有產(chǎn)生任何真正的差異,因為仍然存在不連續(xù),跡線視圖顯示正弦波過程暫停相同的時間-900 ms。

這是因為這些浮點指令有特定的擴展,可以在處理器本身上有一個單獨的、高度優(yōu)化的浮點單元(FPU)。這需要為編譯器指定“fpu”選項?!?mfloat-abi=hard”選項允許編譯器自由地選擇適當?shù)臄U展。

添加“-mfpu=neon”選項指示編譯器為該特定 FPU (NEON) 啟用一組特定的擴展。由于大多數(shù)浮點計算都在單獨的協(xié)處理器上運行,因此其他進程幾乎沒有機會搶占正弦波生成,從而導致不連續(xù)性大大減小。

自定義間隔

Tracealyzer 還可以使用自定義間隔直觀顯示每次正弦計算所需的時間。無需使用帶有計算出的正弦值的 tracef 調(diào)用,跟蹤“開始”和“停止”用戶事件即可跟蹤計算。

在不使用“float_abi=hard”編譯器選項的情況下編譯和運行應(yīng)用程序表明,雖然函數(shù)的大部分執(zhí)行時間大約需要幾十微秒,但也存在一些異常值。在一個案例中,該函數(shù)執(zhí)行時間約為 200 微秒,而在另一案例中,執(zhí)行時間約為 1.05 毫秒!

添加硬 ABI 選項(但不是 NEON 擴展)顯示 100-200 微秒范圍內(nèi)的異常值和一次幾乎花費 1.1 毫秒的調(diào)用。

打開在應(yīng)用程序編譯為使用硬 ABI 和 NEON 擴展時收集的跟蹤信息,顯示最長執(zhí)行時間現(xiàn)在略少于 240 微秒。這突出顯示了使用 NEON 擴展可以顯著減少計算點之間的最差延遲。

使用 LTTng 庫和 Tracealyzer,開發(fā)人員可以看到某些編譯器選項如何影響執(zhí)行浮點計算的用戶空間應(yīng)用程序的性能。通常,這種分析是在事后進行的,當應(yīng)用程序完成但觀察到的性能被視為不可接受時,這需要大量時間。我們已經(jīng)能夠證明,通過在開發(fā)階段使用 Tracealyzer 等可視化跟蹤診斷工具來驗證軟件時序,可以更早地發(fā)現(xiàn)和解決問題。從經(jīng)驗豐富的開發(fā)人員的角度來看,這可以避免隱藏的錯誤,并在項目后期節(jié)省時間和成本。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉