德州儀器達芬奇五年之路七宗罪,嵌入式處理器架構之爭決戰(zhàn)2012
聲明:本文所涉僅局限于嵌入式領域概念的內涵和外延,純屬小民愚見,權當和諸位看官茶余飯后閑聊。
引言
芯片是產業(yè)鏈上游重要的一個環(huán)節(jié),一顆小小的芯片具有極高的技術含量和價值,半導體行業(yè)每年都會有一個各大廠商營業(yè)額的排名,除去2009年,常年盤踞在前三名位置的分別是英特爾,三星半導體和德州儀器,英特爾憑借的是桌面處理器,三星半導體憑借的是其全面的存儲器產品線,德州儀器則是憑借模擬器件,嵌入式處理器和無線半導體這“三駕馬車”。(注:DLP應隸屬于光電器件,所以未計入)
終端是產業(yè)鏈中上游重要的一個環(huán)節(jié),終端廠商用芯片設計出嵌入式硬件,并且基于該硬件開發(fā)相應的嵌入式軟件,從而構成一個完整的嵌入式終端產品,形象的說就是一塊電路板套一個外殼,這里面最重要的一個核心價值的產生就是附加在嵌入式可編程器件上的軟件,成為嵌入式軟件。
系統(tǒng)是產業(yè)鏈中下游重要的一個環(huán)節(jié),系統(tǒng)廠商通過平臺軟件使得多個嵌入式終端通過互聯(lián)網進行信息的傳遞,從而為最終用戶提供產品和服務。如在安防市場,視頻服務器(DVS),硬盤錄像機(DVR)網絡攝像機(IPNC)就是三種典型的嵌入式終端產品,平臺軟件則可以通過互聯(lián)網和局域網管理多個嵌入式終端產品,形成一套基于視頻單工傳輸基本功能的監(jiān)控系統(tǒng);如在通信市場,專用視頻會議終端配合系統(tǒng)集成商提供的平臺軟件和MCU可以形成一套基于視頻全雙工的多點視頻會議系統(tǒng);如在手機市場,iPhone就是一種嵌入式終端產品,而蘋果在線商店就是一個平臺軟件;如在廣電市場,機頂盒就是嵌入式終端產品,結合運營商提供的云服務平臺軟件就可以玩3D游戲。
結合嵌入式市場產業(yè)鏈關鍵構成因素之后,其產業(yè)系統(tǒng)模型可以抽象為:
嵌入式產業(yè)系統(tǒng) = 芯片 + 嵌入式終端 + 平臺軟件
(一)
2005年,TI在C6455的1.2GHz高性能DSP處理器之后,嵌入式處理器部門(DSP-Systems)的整體策略開始轉變,即由以DSP架構處理器為主導的垂直行業(yè)市場戰(zhàn)略向以ARM架構處理器為主導的通用行業(yè)市場進行戰(zhàn)略轉型,率先推出了代號為DaVinci的TMS320DM6446處理器。該處理器采用了ARM+DSP+CP(注:CP即Co-Processor協(xié)處理器)的SoC架構,其中ARM采用了297MHz的ARM926EJ-S內核,DSP采用了594MHz的C64x+內核,CP是一個可以支持視頻和圖像編解碼以及其它常用處理算法的VICP(Video-Image-Co-Processor)加速器。很多觀點認為DaVinci其實在技術上并無創(chuàng)新,因為TI的無線半導體部門的OMAP處理器以及行業(yè)市場的DM270處理器早已經有了類似的架構,但筆者認為,達芬奇處理器最具革命性意義的就是它的全平臺開放性,不同于用硬件直接做多媒體加速的應用處理器,達芬奇處理器提供的ARM,DSP和VICP是三個全部開放且可編程的內核。達芬奇技術的核心其實并不在于硅片本身,而是基于Linux的那套軟件框架,它把一個基于多媒體應用的嵌入式軟件抽象為應用軟件和算法軟件,采用CodecEngine框架組件規(guī)范了算法軟件的開發(fā)標準(xDAIS)和統(tǒng)一接口(xDM),應用軟件通過CodecEngine來調用算法軟件,在這個層面上,應用軟件只運行于Linux之上,并不關心Linux運行于何種處理器內核上,算法軟件被CodecEngine統(tǒng)一管理,所以應用軟件也無需關心算法軟件運行于何種處理器內核上。用CMEM組件來管理DSP和ARM之間的共享內存,用DSPLink把DSP和ARM之間的通信模擬成一個類似于Linux多進程之間的RPC(Remote-Procedure-Call),這其實是一件非常好的事情,可以使得DSP算法工程師和ARM應用工程師并行工作而又確保了最后軟件集成的統(tǒng)一規(guī)范。
雖然這一次,TI有專門的商用Linux開發(fā)商MontaVista為DM6446定制開發(fā)的內核,有全球多家第三方合作伙伴如Ateme,Ittiam,Ingenient開發(fā)的高性能Codec,有中國本土著名IDH時代飛騰提供的RMVB播放器解決方案,但是在2006年,DM6446在通用市場的推廣之路卻并非一帆風順,因為DM642的客戶已經習慣了在Windows操作系統(tǒng)下一個名曰CCS的集成開發(fā)環(huán)境里,寫代碼,編譯,仿真,下載到目標板跑程序,可是突然讓他們面對陌生的Linux系統(tǒng),通過敲寫命令行去編譯代碼,使用vi寫代碼,安裝一堆Linux下的LSP,文件系統(tǒng),交叉編譯環(huán)境和DVSDK后還得配置一堆環(huán)境變量和路徑,才能勉強運行一個例程?OMG!幾乎所有的DM642使用者都發(fā)出了不可思議的驚嘆,原來世界還有如此“落后”的開發(fā)方式和文本編輯器。
試想一下,如果那個時候TI能夠基于Eclipse推出一個類似于GreenHill的IDE那樣的SoC集成開發(fā)環(huán)境,使得DM642的用戶可以無縫過度到DM6446,那應該是怎樣一種幸福?難過的事情并不止于此,層出不窮的內核Bug和匱乏的獨立開發(fā)DSP端算法的資源可是苦了做產品的企業(yè),光是一個Audio OSS全雙工的Bug就愣是N個月沒有給出完全搞定的Patch,那個時候可真是一個內核升級的Patch都十分搶手,更別說擁有Linux下的cgtools和dspbios安裝包可以笑傲江湖,如果誰再有了DVSDK,那簡直可以仙福永享,壽與天齊了。
那個時代,是一個DSP和VICP依然屬于行業(yè)寡頭的時代。
所謂兵馬未動,糧草先行。如果把芯片比喻成兵馬,那開發(fā)工具就是糧草,TI應該同步推出基于Eclipse的雙核集成開發(fā)環(huán)境替代CCS,筆者猜想TI剛開始是想拉動一票業(yè)內公司構建一個完整的達芬奇處理器生態(tài)環(huán)境,像IDE,Codec,OS都找第三方合作伙伴定制,但是要知道,拉人家入伙不是錯,入了伙客戶不買單那就是天大的麻煩,結果別說IDE和OS賣出去的寥寥無幾,就連Codec也是評估的多,買單的少,全中國達芬奇的粉絲們都在日夜趕工的定制有中國特色的Codec。。。
在TI推出了DM6446這顆旗艦產品之后,又陸續(xù)推出了DM6441,DM6443,DM6446低頻版本和工業(yè)級版本等處理器。這里面不得不說的一個公司就是時代飛騰,這是筆者很欣賞的一個公司,在DM6441的殺手級應用里,時代沸騰的MP5方案可謂是曾經風光一時,在沒有硬件RMVB解碼器的時代,DSP再一次展現了可編程的魔力,遙想當年,華旗推出的基于DM6441的高端MP5產品也是名噪一時,后來,時代飛騰又基于DM6441推出了網絡電視一體機的方案,但是DM6441的價格居高不下使得這個曾經是TI陣營王牌IDH的公司徹底轉向Telechips的平臺,筆者在時代飛騰的一個朋友抱怨到,TI一顆芯片都趕上別人的一個BOM了。那個時候我就在想,究竟怎樣的附加值和商業(yè)模式才能擊碎消費市場產業(yè)鏈的利潤“微笑曲線”,還是終究在消費市場做IDH就是一個利潤夾縫中茍延殘喘但又創(chuàng)造著將冰冷的芯片變成有生命力產品奇跡的商業(yè)行為?
(二)
在第一輪達芬奇熱還未褪卻之時,TI又推出了由十余種處理器構成的DM643x家族,這完全可以看作是DM644x家族去掉ARM內核和VICP加速器之后的產品,伴隨著DM643x處理器出現的還有一個在技術上非常拉風的東西,那就是跑在DSP內核上的Linux虛擬機,這是一家叫做Virtuallogix的公司做的軟件產品,它可以使得DSP支持Linux,這再一次證明了TI想在Linux下統(tǒng)一管理和開發(fā)它的全部嵌入式處理器的軟件框架戰(zhàn)略,在前面提到過DVSDK里的一個組件叫做CodecEngine,它可以使得應用軟件通過RPC調用算法軟件完成多媒體算法的調用,而不必關系多媒體算法在物理上究竟是運行于ARM還是DSP,在DM6446時代,或許覺得這無非是故弄玄虛,畫蛇添翅膀,但當DM643x上跑著Linux的時候,一切都明朗了,基于CodecEngine開發(fā)的應用程序可以無縫的在DM643x和DM644x的Linux上平滑過渡,這或許就是軟件框架的優(yōu)勢吧。
在被DM644x虐了1年后,水深火熱的工程師們仿佛終于看到了曙光,終于看到了一顆貌似可以繼承DM642衣缽的達芬奇處理器了,終于可以在CCS下繼續(xù)裸奔著DM642時代的程序了,終于可以在一個彩色的視窗集成開發(fā)環(huán)境里拋開萬惡的xDAIS算法標準寫有中國特色的Codec了。于是,DM643x因為有著比DM642更先進的DSP內核架構和達芬奇響亮的名頭走進了千家萬戶,在終于找到了CSL并且拋棄了虛擬機之后,工程師們又開始抱怨,為什么DM6437只有一個VPFE而并非像DM642有多個VPort呢,這對處理多路視頻將是多么的復雜,于是DM643x被打入冷宮,直到DM3xx應用處理器的IPNC大行其道,才被重新定為視頻分析協(xié)處理器,視頻分析軟件供應商ObjectVideo將DM643x做成獨立的視頻分析模塊,但阻礙這顆達芬奇處理器涅磐的依然是ObjectVideo昂貴的軟件入門費和版稅。
不知是機緣的巧合還是天意,在DM643x家族問世后不久,DM648橫空出世,這是一個至今已經可以跑到1.1GHz的DSP處理器,它集成了2個千兆以太網接口和5個VPort視頻口,DM648才是真正的將DM642精神發(fā)揚光大的產品。在萬眾矚目下,一個奇怪的事情又發(fā)生了,DM648的開發(fā)板居然不是TI御用的Spectrum公司設計的,相關的設計資料也是乏善可陳,至今仍然想不通為什么DM648為何落得如此下場,國內第三方做DM648開發(fā)板的跟DM6446簡直不在一個數量級。從性能上看,DM648非常適合做多路CIF格式的視頻產品,該處理器的5個VPORT口都是16比特數據位寬,和DM642一樣可以同時吃進2路BT656格式的視頻,內部采用了DSP+CP的架構,其中CP和DM644x的VICP是一樣的,可以支持8路CIF格式的H.264視頻編碼。
(三)
2008年,注定是不平凡的一年。
TI或許已經意識到了在中國這樣一個神奇的土地上,有這樣一個潛規(guī)則,那就是只有硬件是可以賣錢的,硬件上跑的所有東西你都要送我。于是TI開始做出這樣一個決定,Linux內核維護從以MonvtaVista為主樹轉移到以自己維護的內核為主樹,逐漸往Community Linux靠攏,徹底擺脫MontaVista;于是TI開始做出這樣一個決定,自己做Codec,因為客戶聽到第三方Codec昂貴的入門費統(tǒng)統(tǒng)都嚇跑,自己去做有中國特色的Codec去了,TI可郁悶了,這得做到猴年馬月才能量產,于是N多項目胎死腹中。
當TI開始逐步透露要做Codec并且有可能免費的消息后,在業(yè)內也算引起了不小的震動,雖然TI一再在每年一度的全球第三方峰會上說他們只是做一些基本功能的Codec以應對其它半導體廠商應用處理器的免費Codec帶來的競爭壓力,但是,Ateme還是轉向FPGA平臺,Ittiam傳言準備自己做ASIC,Ingenient則被Sasken收購,而此時的時代飛騰,則徹底放棄了TI的平臺,轉向更加經濟實惠的Telechips和Marvell,于是,TI的Codec陣營就在這一年土崩瓦解。
但是事情遠比想象的嚴重,這位行業(yè)巨鱷開始全面拉低嵌入式處理器產品配套工具的利潤,達芬奇處理器的性能雖然是一路飆升,但是相應開發(fā)板的價格確實越來越低,最后TI終于祭出大招,OMAP3530的BeagleBoard以一種社區(qū)開源模式面世,所有的硬件設計源文件以及驅動和操作系統(tǒng)都可以從網絡社區(qū)下載,用于僅需要99美金就可以買到的BeagleBoard開發(fā)板,而同年份,合眾達的560仿真器跳水到4800一只,BlackHawk又推出僅199美金的560Plus仿真器,國內幾家傳統(tǒng)ARM開發(fā)工具供應商的OMAP3530開發(fā)板價格全部在千元以下,DM642時代高利潤的藍海時代頓時變紅,而且還飄著不少第三方的尸體。令人感到不解的是,進入嵌入式市場的OMAP3530處理器依然保持著移動市場特有的0.5mm點距和PoP封裝,過了好一陣子TI才發(fā)布0.65mm點距的硅片。OMAP是TI在移動市場處理器的旗艦產品線,在2008年底推出的OMAP3530集成了Cortex-A8內核,C64x+的DSP內核和硬件加速器,并且還具有PowerVR的圖形加速器。雖然血統(tǒng)不同,但OMAP3也可以粗略看作是DaVinci架構的低功耗版本,但跟DaVinci不同的是,OMAP3530加強了GPP的性能,削弱了DSP的性能,一個考慮是進一步降低功耗,另一個則是市場因素,達芬奇處理器主要用于做視頻壓縮的產品,而OMAP3都是面向做視頻解碼和圖形顯示的產品,于是國內國外用DM6441做移動電視和便攜式播放器的廠商為了保持競爭力又不得不轉移到OMAP3平臺上,因為該平臺不僅有3D圖形加速器,可以做3D導航和玩游戲,還有比DM6441更低的功耗和更強的GPP資源。在2009年的TI開發(fā)商大會上,Cortex-A8內核確實是獨領風騷,OMAP陣營的參展商一舉壓倒了DaVinci參展商,諸多的Android,WinCE獨立軟件供應商和無線模組供應商開始加入TI的陣營,而TI發(fā)布以ARM為主導的產品數量已經開始超過以DSP為主導的產品數量了。
像TI這樣的公司,在以DSP架構為主的產品發(fā)展時期,結盟了眾多第三方助陣,而當以DSP架構為主的產品走到成熟時期,TI則毫不猶豫的踹掉了這些第三方公司(雖是無奈之舉但畢竟是不爭的事實),為的就是進一步降低通用市場客戶的入門成本,舉個例子就是:以前10萬美金的Codec入門費對垂直行業(yè)的那些寡頭算個毛,但對通用市場的客戶來說,打死也不會掏錢的。所以,在商場上,只有永恒的利益,沒有永恒的友誼,TI這么做是戰(zhàn)略轉型的必然結果。
(四)
為了在高清網絡攝像機(HD-IPNC)市場拔得頭籌,TI在2008年初率先推出了可以做到720P30實時MPEG4編碼的DM355處理器,和OMAP3一樣,DM355處理器帶有濃重的行業(yè)寡頭特色,它原本是一顆做數碼相機的處理器,所以擁有2個SD卡接口卻沒有EMAC,大概是柯達的數碼相機并沒有連網的需求吧,于是Spectrum通過DM355的EMIF總線接口擴展了百兆以太網接口,但這還遠遠不夠,DM355平臺為了降低成本,拋棄了DM644x和DM643x家族采用Nor lash作為啟動存儲器的方案,改用SLC NAND閃存存放啟動代碼和文件系統(tǒng)。
為了進一步降低成本和推進市場增長,TI選擇了Appro公司為其定制高清網絡攝像機參考設計,在這一點上,TI的思路是非常正確的,因為在高清分辨率下,CCD傳感器非常昂貴,而CMOS傳感器像原尺寸又做不大,導致本身在低照度下就就性能欠佳的CMOS傳感器的成像質量在高分辨率時是差上加差,于是TI在DM355處理器內部集成了一個叫做ISP的硬件影像處理單元,可以直接支持RAW格式數據的處理,我們姑且管這一塊叫做影像預處理,有了ISP,DM355處理器就可以無縫的對接各種圖像傳感器了。再來看看圖像傳感器供應商,Aptina的傳感器一般叫做Sensor,可以直接輸出RAW格式的數據,Ovt的傳感器一般叫做SoC,內置了ISP,低分辨率的產品可以直接輸出YUV的數據,高分辨率的產品也是輸出RAW格式數據。不知是因為TI和Aptina高層的關系很好,還是為了彰顯DM355處理器ISP的英明神武,在Appro的這個參考設計里選擇了Aptina公司的MT9P031 5MP傳感器,專門使用DM355的ISP開發(fā)了針對MT9P031 CMOS圖像傳感器的影像預處理算法,于是變形金剛合體,在2008年初,萬眾矚目的720P高清網絡攝像機參考設計閃耀登場。
TI認為自己的這番努力已經秒殺了掌握最先進ISP技術的日系廠商,成功的把DSC的成像技術移植到了IPNC,勢必會引爆一個巨大的市場,高清視頻,極低的成本,成熟的ISP技術,甚至連鏡頭和外殼連帶完整的硬件參考設計都已經準備就緒,整個BOM成本不到40美金,而整個參考設計除了提供全套硬件源文件外還有全套的Linux參考軟件,整套方案售價僅為995美金,這個就是Appro在2008年TI開發(fā)商大會推出的DM355高清網絡攝像機參考設計,但是請注意,這僅僅是一個參考設計,而不是一個深圳模式下的解決方案。
在深圳,只有MTK那樣的才叫解決方案,英文叫Turn Key,套用大腕兒里的一句話,什么叫方案知道么?只要注入一筆錢,再找個工廠一量產,產品和利潤就出來了,我們做方案的口號就是,不求最好,但求最快!是的,當時筆者還真是聽說深圳有人直接拿Appro的這個參考設計去工廠生產,結果自然是無法量產,投資失敗,因為Appro此次的“方案”并非MTK的“方案”之含義,準確的說仍然只是一個參考設計框架,而不是一個立刻可以被量產的產品。為了推廣DM355處理器,筆者也曾多次前往深圳,記憶頗深的是拜訪一家做網絡攝像機的客戶,研發(fā)總監(jiān)親自接待,說:“你們(其實筆者非TI的人)的這個DM355壓縮效果不行,我接高清電視看了,都是馬賽克?!惫P者頓覺驚詫莫名,問道:“您是用復合視頻接到高清電視上看的?”該總監(jiān)道:“正是?!惫P者頓覺無語,須知復合視頻怎可傳遞高清視頻信號?好吧,遂指出該總監(jiān)“疑惑”,為DM355正名,繼而該總監(jiān)又說到:“我們現在用其它方案D-In,網絡攝像機量很大,我們只要每臺掙1個美金就可以開始跑量!”這就是一個非常典型的深圳市客戶,他們崇拜的是MTK式的神話,他們需要的是一個可以馬上量產的方案,他們需要的是一個可以帶動生產力和現金流的Turn-Key-Solution,他們的特點就是簡單快速,薄利多銷。
從技術角度看,DM355的功耗和性價比還是非常不錯的,采用了0.65mm的點距,內建了ISP裝置得以處理Aptina的5MP像素傳感器的RAW格式數據,該傳感器使用了2x2的binning模式來增強成像質量,可以輸出720P30的MPEG-4視頻流。但遭人詬病的是,DM355內部的ISP行緩存不夠長,在做5MP抓拍的時候,需要2-Pass才能完成處理,2-Pass就是先把圖像采集到內存,上半邊通過ISP處理一下,下半邊再通過ISP處理一下,也正巧了,趕上那年交通行業(yè)的相機都要5MP抓拍,惹得全國上下用DM355做相機的廠商怨聲載道,那能搞出5MP抓拍的都是神仙?妖怪?
如果DM355定為于啟動低成本高清IPNC市場的引信,TI是絕對應該找一家平臺軟件供應商推系統(tǒng)方案的,Appro的參考設計和深圳模式是不搭調的,也錯過了山寨高清網絡攝像機的第一桶金,后來的DM365和DM368時代,Ambrella和MG3500已經可以在這個市場分到一杯羹,TI人無我有的戰(zhàn)略優(yōu)勢喪失殆盡,頓時變成了人有我優(yōu)。。。
(五)
2009年春暖花開之時,TI果然毫不遲疑的推出了能支持H.264 720P30壓縮的DM365達芬奇處理器,該處理器可以認為是DM355的完善版本,除了更新了ISP之外,DM365使用了和DM355相同的ARM926E-JS內核,使用了DM355的MJCP硬件加速器,這個加速器可以做MPEG4的編解碼和JPEG的編解碼,同時加入和DM6467的HDVICP0這個可以支持H.264硬件編解碼的加速器,構成了DM365的基本架構,當然,植入一個EMAC彌補DM355的雞肋還是不難的。這里面請注意,TI在HDVICP0上一直沒有MPEG4和JPEG的Codec,雖然HDVICP0號稱可以支持MPEG4,于是就只好來一個組合拳,可以說DM365是DM6467和DM355聯(lián)姻的結晶。但是光720P還不夠,DM365的弟弟DM368在2010年也會出世,要問怎么做到1080P的,超頻,超頻?。?!
DM36x既然出來,Appro自然也不會閑著,在2008年以摧枯拉朽之勢忽悠了眾多客戶之后,2009年繼續(xù)推兜售他們的ISP算法,這次不光是Aptina的傳感器,Sony和Ovt的傳感器也用上了。說到傳感器,這里有一個有趣的現象,在Aptina剝離Micron之后,TI開始很低調的做一種基于CMOS技術的寬動態(tài)傳感器產品線,那么自然可以大膽推測,憑借TI的野心和實力,既然想把網絡攝像機做到白菜價,那么它就得把CMOS傳感器和DM368做到一顆芯片里,真正的實現“俺們也就走個量,一個只掙1塊錢”的宏偉藍圖。
從技術角度看,DM355處理器的MJCP是由DM644x/DM648的VICP演變而來,而DM36x的集成度要比DM355強一個檔次,不僅集成了AudioCodec,還能在單通道視頻接口VPFE上做多路視頻流的Demux,NAND閃存控制器也從DM355的1-bit ECC變成了4-bit ECC,而且還支持硬件人臉檢測功能,同時解決了ISP內部行緩沖不夠的問題,終于可以支持1-pass的高分辨率圖片抓拍。在參考設計資源上和DM355不同的是,DM365除了Appro提供的IPNC參考設計,還有UDWorks公司的DVR參考設計,該參考設計可以支持8-CIF或者2-D1的視頻壓縮,使用了一顆TI同步推出了高性能四通道視頻ADC芯片TVP5158,大概是看到Techwell在DVR市場賺了不少,TI也開始做多通道的視頻ADC產品,剛想說那Techwell的市場應該會讓出一部分,就聽聞Techwell以3.7億賣給Intersil了。。。
DM6467T作為DM6467家族的最高端產品,擁有近乎1GHz主頻的DSP內核,500MHz主頻的ARM926E-JS內核以及2個HDVICP硬件協(xié)處理器,其中HDVICP0可以支持H.264/VC-1/MPEG-4高清編碼,HDVICP1可以支持H.264/VC-1/MPEG-4/MPEG-2高清解碼,而該處理器顯然和任何一款DaVinci家族的處理器不同,它的VPIF決然不同于VPFE和VPORT,該端口僅支持嵌入同步的視頻格式,但是卻可復用為TS流傳輸或接收模式,可以非常方便的支持DVB-ASI接口,這是一顆明顯帶有廣電行業(yè)特色的處理器,它可以單芯片實現MPEG2到H.264的實時轉碼功能,并且支持千兆以太網接口,而且一直號稱可以支持1080P60 H.264高清編碼。
TI這種從DSP單核心架構到DSP+ARM+硬件加速器SoC架構再到ARM+硬件加速器SoC架構的轉變過程非常之快,在不到3年時間內先后快速推出多種處理器,而且還都是先找寡頭買單,再挪到通用行業(yè)市場。從某種意義上說,觀望的客戶會引起“審美疲勞”,跟進的客戶會發(fā)現“投資貶值”,也就是TI并沒有很好的保護客戶對它的投資。在DM642時代,是一招鮮,吃遍天,只有一顆處理器,無論客戶做多少個產品線,多少種產品,只用維護一種開發(fā)環(huán)境和軟件,只用保持為數不多的一個BOM清單即可;可是到了達芬奇時代,DM644x算法買不起,自己做吧,還沒做完,DM357出來了,那就用DM6467做720P產品,結果DM365出來了,只好用DM6467做1080P產品,結果DM368又呱呱墜地;如果剛用DM6441做完D1 H.264網絡攝像機,DM355的720P MPEG4又得換一套DVSDK,還得琢磨0.65mm的點距,從644x的NorFlash換成SLC NAND;1年后,沒轍,繼續(xù)跟進DM365,這時候估計已經比放棄DM355,專盯著DM365的客戶要慢了幾個月了;君不見DM365官方開發(fā)板上輝煌的電源方案足可以引多少英雄豪杰竟折腰(用了十幾種);相比于Ambrella的IPNC方案和海斯的DVR方案,TI的參考設計又明顯缺乏成熟的“山寨化”軟件;縱觀跟進TI的烈士般的公司們,累的跳樓的心都有了,光是那一套套不一樣的DVSDK,一堆堆形形色色的Patch,就已然頭昏腦脹了。。。
(六)
TI在2009成功收購了Luminary,補強了MCU的產品線,形成了以MSP430,Cortex-M3和Cortex-A8為核心的高中低檔全線MCU產品線,初步實現了硅片產品的戰(zhàn)略布局。在軟件方面,拋開MontaVista之后,Linux全面轉向Community陣營,IDE轉向基于Eclipse的CCS4.0,至此,算是基本完成了由DSP為核心的處理器架構向以ARM為核心,DSP,硬件加速器為輔的處理器架構。TI的網站在2010年也做了結構性的調整,Processor下面出現了ARM,DSP和MCU三個板塊。
DSP這種處理器架構還能保持多久的生命力是一個值得探討的問題,嵌入式處理器市場的競爭本質還是架構之爭。有一個觀點是任何一個處理器設計公司都不會同時維護兩種架構的處理器產品,如Intel公司先是改造ARM架構,做出XScale處理器,但是后來卻賣給了Marvell,為的就是統(tǒng)一桌面處理器和嵌入式處理器的架構,后來推出的Atom等一系列處理器都是基于x86架構的瘦身產品,且不說Marvell吃進Xscale后賺的盆滿缽滿,Xilinx也將在Spatan-6和Virtex-6之后統(tǒng)一自己FPGA架構。TI又何嘗不想如此,但是因為它的產品線過于龐大,也就注定需要很長的時間了。首先在C64x和C64x+的DSP內核架構之后,又推出了C674x+內核架構,該架構統(tǒng)一了浮點DSP和定點DSP內核;其次在DM8168和OMAP4處理器上,TI則會統(tǒng)一硬件協(xié)處理器的架構,即OMAP4和DM8168都采用IVA-HD這種相同的硬件加速器;至此,TI在SoC上已經形成了C674x+Cortex+IVA-HD的統(tǒng)一架構SoC雛形。
記得ADI公司早在若干年前就關閉了以色列的TigerSharc設計中心,其理由是,該處理器已經登峰造極,沒有再發(fā)展的必要;在桌面處理器市場,主頻提升早已遭遇瓶頸,多核心時代正在到來,而ARM此時已經不聲不響邁入雙核2GHz的Cortex-A9時代。TI的DSP也是如此,C6000架構已經成熟多年,1.2GHz似乎已經是不可逾越之極限,于是2009年TI發(fā)布了3個1.2GHz核心的高性能多核DSP處理器TMS320C6474,這也是一顆從垂直行業(yè)市場拿到通用市場的處理器(TI開始曬家底兒了?),隨后又發(fā)布了擁有6個700MHz內核的TMS320C6472多核DSP處理器,但恐怕由于功耗的原因,基于65nm工藝的C647x系列很難再有突破。多核心DSP未來的道路確實很艱難,因為它已經處于一個非主流的位置,雖然不排除在更先進的工藝節(jié)點上植入更多的DSP內核甚至是Cortex-A9內核完成統(tǒng)一處理器架構和軟件框架的瘋狂構想。
(七)
在Intel收購風河公司,Xilinx和ARM結盟,Altera和MIPS聯(lián)姻,Winter聯(lián)盟被ARM和Google瓦解之后,嵌入式市場就要好戲連臺了。在Intel沒有想明白是不是像ARM那樣進行IP授權來運營Atom的時候,請將目光移向ARM陣營,Altera其實在很早以前就有過一款集成了ARM7硬核的FPGA產品,筆者非常奇怪為何Altera要做這樣一個看起來并不十分明智的產品,須知在那樣一個年代,一個昂貴的,功耗很大的FPGA去聯(lián)姻一個廉價的,功耗很低的RISC究竟意義何在?而Xilinx在SoPC的戰(zhàn)略上無疑是成功的,它選擇了同樣昂貴,功耗很高但同時性能也很高的PPC硬核,從Virtex-II一直到Virtex-5的產品中都可以看到集成PPC硬核的產品,但是這一切都將在28nm節(jié)點工藝改變,在28nm技術上,Xilinx選擇了高性能低功耗的工藝,而Altera則選擇了更高性能但高功耗的工藝。因為在28nm,Xilinx將植入Cortex-A9硬核處理器,創(chuàng)造真正的低成本,低功耗的SoPC產品,繼續(xù)向嵌入式市場挺進,試想如果一顆集成了Cortex-A9的SoPC芯片售價15美金,你還會選擇相同價位的SoC嗎?筆者認為Xilinx選擇在28nm節(jié)點統(tǒng)一產品架構是因為此時FPGA的功耗和成本跟PPC已經不再匹配,ARM才是最好的選擇。
如果TI的嵌入式處理器產品線架構是一個線性空間,那么它的正交基是:DSP內核,ARM內核,硬件加速器和通用外設,用公式表述一個TI的SoC定義為:
TI SoC = a * DSP + b * ARM + c * Accelerator + d * Peripheral
而當FPGA在28nm擁有Cortex-A9的雙核處理器和標準外設,客戶已經可以在功耗和成本都可接受的SoPC上定制自己的硬件加速器和接口設備,用公式描述一個Xilinx的SoPC定義為:
Xilinx SoPC = a * ARM + b * Customer-Accelerator + c * Customer-Peripheral
一種新的嵌入式處理器架構的誕生或多或少都會引起變革,2005年是TI的SoC,2012應該屬于Xilinx的SoPC。