【導讀】今天的SoC設計變得非常復雜,包含多種IP單元和處理器,以及軟硬件的集成。因此,設計一款芯片以及把它推向市場所需的成本越來越高。產生這個現象的主要原因是設計方法還沒改變,大家都還在用JTAG這種有30年歷史的設計方法。
現在,數據中心和服務器這些大數據的互聯網公司都在開發自己的芯片去優化網絡。其原因是,根據調查,每有100ms延遲就會使營業收入減少1%。此外,我們也必須考慮符合汽車功能安全,以及網絡安全,防止黑客攻擊。
Synopsys公司的總裁兼CEO Aart de Geus曾反復談到系統復雜性,因為今天的芯片里有太多的單元和軟硬件的協同。
設計開發成本和上市成本越來越高的原因,是設計工具和設計方法都還是很傳統,大家都是在單元級上做開發。現在每個單元內部都有非常好的成功的工具和方法,但都不是系統級的解決方案。
UltraSoC是一家總部位于英國劍橋的小公司,辦公室離徐志摩當年戰斗過的地方很近。他們的IP就是要幫助客戶解決這些芯片設計所面臨的最大問題。
UltraSoC公司首席執行官Rupert Baines日前在媒體溝通會上告訴記者,UltraSoC的商業模式和ARM一樣,他們的IP應用到Intel、海思、Imagination和Microsemi這些公司的芯片中。
UltraSoC是一家什么樣的公司?為什么能解決芯片設計問題?
UltraSoC目前還是一家由VC提供資金的公司,共有25名雇員,所有的技術來源于大學。特別是投資陣容很強大,公司的董事長是加州伯克利大學分校的一位教授,同時也是Synopsys和Cadence的聯合創始人。
UltraSoC幫助客戶解決很多業務本質的問題,包括怎么讓產品更快上市,怎么去優化軟硬件的協同,怎么引入RISC-V等等。
那么,UltraSoC的技術為什么能解決這些問題?他們有一個庫,這個庫大概有30多個組件。系統設計師把這些組件用在SoC設計的各個部分,就能去解決這些問題。
“UltraSoC的組件能夠智能地懂得SoC中的各個單元和軟硬件,包括可以了解ARM、RISC-V和MIPS的軟件,也可以了解硬件,這些組件被叫做互連內存控制器。總而言之,UltraSoC可以把SoC的各個部分放到一個系統中去,可以全局性地看到SoC設計中硬件和軟件的整體狀態。”Rupert Baines說。
下圖是一個典型的客戶設計。這個手機處理器中有ARM處理器,也有可以理解ARM軟硬件的組件,同時也有CEVA的DSP。對于UltraSoC,他們的軟件也能理解DSP的設計,同時也可以作為一個整體來進行了解。
UltraSoC也有專門針對硬件的組件,比如針對總線和芯片互連的組件。同時它們把所有這些軟硬件分析功能放到一個整體的分析功能下。
他們的IP可以去解決很多問題,比如很常見的一個問題是,在做一個芯片設計的時候,這個CPU的確工作,但是速度沒有其在做產品定義和規劃的時候這么快。問題出在哪,怎么解決它?UltraSoC就是幫助解決這樣的問題。
UltraSoC的系統還可以解決很多系統級的問題。比如系統被掛起或死鎖,是電子系統中很常見的問題,每隔一段時間就會發生。“當年我在Picochip的時候(編者注:在加入UltraSoC之前,Baines是Picochip的市場營銷副總裁。在Picochip被Mindspeed/現并入英特爾收購之后,他擔任Mindspeed的市場營銷策略副總裁。),那時正是TD-SCDMA大發展的時候,曾經當地一家合作伙伴面臨的問題是,系統大約每8天就會死一次機,對于系統設計人員來說是件很頭痛的事情。”Rupert Baines回顧到。
“系統被掛起或死鎖是系統設計中一個非常嚴峻的挑戰。你去做仿真,剛才說的大概每8天死一次機,仿真速度很慢。所以,要做一次仿真,一周接一周地去做,還不一定能找到問題,這是個很麻煩的挑戰。而對于UltraSoC來說,去解決這樣的問題非常方便、非常快,從而給設計人員帶來很大的方便。”他補充說。
下圖列的是UltraSoC片上分析IP的好處。由于其IP是一直處在芯片內部的,所以既可以用在實驗室做產品研發的調試工作,也可以在產品應用現場,在不同的應用場景下去了解和優化芯片設計。
另外對于網絡安全標準(防止黑客入侵)其汽車ISO26262標準,UltraSoC也都提供支持。他們的IP可以觀察芯片是否正常工作。UltraSoC的IP面積很小,只需要不到1%的裸片面積,就可以大大提高性能,同時減少bug,還可以降低功耗。按照一項研究,它同時也可以加速產品上市,利潤率可以達到2.3倍。
UltraSoC提供怎樣的解決方案?
UltraSoC的IP包括3個層面上的解決方案。第一層是大約30種的分析模塊,其功能是能夠理解芯片SoC的不同部分,比如ARM、RISC-V和CEVA的軟件,以及總線、系統互連的狀態。它們的優點是本地化的智能。所有這些模塊都是在本地化工作,就在相關單元的旁邊以系統級的速度來工作,同時不是侵入性的,在系統內不可見,不會影響任何系統的性能。
第二層是互連,它的各個模塊通過網絡進行溝通,并可以被動態重新配置。用戶可以設置if-then關系,進行交叉觸發。因此,如果處理器有問題發生,就可以終止活動;如果總線上出現某個模式,用戶就可以查看處理器當時的狀態。如前所述,模塊之間的相互依賴關系是芯片設計的一個問題。
最后一部分是他們的連接通信器。這些IP單元和外部世界需要連接到一起,這些通信器可以用芯片設計中非常標準的JTAG接口來做連接,也可以用常用的以太網、PCIe、USB接口把芯片內部的分析IP和外部環境連接到一起。
另外,UltraSoC還有片上工作的模式。比如一個芯片已經發貨了,這些IP不再需要跟設計師做溝通,它們也可以幫助芯片去優化性能和功能。
UltraSoC提供所有軟硬件的全面可視化操作系統,下圖是UltraSoC的典型操作界面。中間是軟件跟蹤顯示,綠色加亮部分是處理器代碼的一個斷點。右邊顯示的是硬件。當斷點出現的時候,總線上當時正在做什么操作,有什么信息的溝通?相應的硬件行為也可以看到。右邊是統計數字,包括內部架構上的延遲。
如果是軟件開發工具,很多公司都有,而能夠同時提供軟硬件和相關統計數據的公司,目前只有UltraSoC。
最左邊是模塊的工作情況。中間是處理器的工作情況,可以支持UltraSoC的IP,目前來看可以支持客戶開發最多的數量是256個核,另外還有客戶正在開發最多4000個核的芯片。
在絕大多數SoC芯片或電子系統中,從右上角的統計數據來看,系統工作都是一開始性能慢慢提升,到了一個高點后,系統性能下降,有可能是你的內存出現泄漏,或者總線出現擁堵,或者其它的一些原因。UltraSoC就是幫助你分析和找出具體的是哪些原因。
現在我們看到的是更多的案例,有一個非常常見的問題,就是UltraSoC的緩存問題,這個時候大家的CPU設計并沒有問題,這是一個軟件的問題。你需要去找相關的軟件問題,如果用它們的工具可以很方便的解決這一類的問題,緩存的優化可以使CPU的性能提升20%。
后面兩種情況是存儲器、控制器的問題。這是芯片中非常復雜的設計,需要很優化的設計。在高速存儲數據中,存儲器、控制器有可能成為數據存取的瓶頸。比如左邊的存儲器的情況,是系統的存儲不平衡;右邊是存儲的流量峰值的波動和突發,用UltraSoC就可以很方便的幫助設計人員發現這些問題。左下角的案例,如果不用UltraSoC就基本不可能去發現這些問題,但是在系統實時工作的情況下,出現一個小小的問題讓Modem崩潰了,用別的工具很難發現,而用UltraSoC就很容易找到這個原因。
UltraSoC也可以在實驗室作為工程開發工具來使用,即在芯片流片后拿到樣片,在商業發布之前可以在實驗室作為工程開發工具來使用。同時UltraSoC在產品生命周期都能用,比如有一家很大的客戶(high-profile, sexy and secret,大家自己去猜)用UltraSoC的片上分析 IP。這家客戶的芯片,在汽車在駕駛的時候會不斷監測芯片的狀態,這是可以滿足ISO26262標準的IP,這個標準在汽車領域是非常難通過的,也是非常重要。
另外一個跟安全性(safety)一樣重要的是網絡安全(cyber security)。UltraSoC的IP是從硬件層面對芯片狀態進行實時監控,可以發現任何工作不正常的地方。“因此,我們可以發現DDoS攻擊,即使CPU無法工作(忙),也能發出警報。”這是因為UltraSoC的IP是在硬件中,是操作系統所看不見的,所以攻擊者不可能阻止或干擾這種監控。不像其它的軟件層信息防范工具,黑客進攻是可以去停止或欺騙看得見的防范工具。
當筆者問到,UltraSoC IP在現場使用,如果CPU遭受DDoS攻擊,它都已經無法響應了,又怎么去解決問題?Baines解釋到:“網絡安全通常涉及到很多層,非常復雜。現在,我們的客戶在使用我們的方案時是用的2個CPU:一個是系統CPU,它運行主程序,暴露在外部世界中;一個是監控CPU(supervisor),獨立于前者,攻擊者訪問不到。若有攻擊發生,監控CPU將對系統復位,并通過一個分離的鏈路發送警報。”
互聯網公司為什么要開發自己的服務器芯片?
對于UltraSoC最大的市場是數據中心和服務器。其原因是,這些數據大的互聯網公司都在開發自己的芯片去優化網絡。比如美國的亞馬遜、微軟、Facebook,中國的百度、阿里巴巴、騰訊都在做自己的芯片。華為海思、高通這些公司也都在做服務器和數據中心用芯片。
為什么它們要自己開發芯片?因為像阿里巴巴這樣龐大的營業收入,他們要確保自己的服務器工作很流暢。亞馬遜有一個研究,100ms的延遲會使營業收入減少1%,對于亞馬遜這么的收入來說,1%的收入會是很大的損失。所以這些互聯網公司都在努力讓系統工作得很流暢、很正常。(有興趣者可以到UltraSoC的網站去看一下,有一篇白皮書很全面介紹了互聯網和服務器IP之間的關系。這份谷歌和微軟做的調查,很詳細介紹了延遲帶來的損失。)
總結來說,UltraSoC的IP在客戶的SoC里不斷地對芯片進行分析并收集相關數據。這些數據可以被設計人員用在不同的地方,比如在開發階段縮短上市時間,可以去創建更好的產品。除了剛才說的開發階段用的數據外,還有非常有價值的信息,可以用在更多的地方,讓芯片可以工作得更好、更可靠,并有更少的問題。而且你也可以在產品的整個生命周期上去使用它們的IP,比如用于ISO26262功能安全以及網絡安全方面,可以監控芯片,防止惡意攻擊。
UltraSoC在RISC-V的整個生態里做出了很大貢獻并且也很成功。RISC-V類似于Linux,是一個開源的CPU,當然包括商品化的CPU設計(類似紅帽Linux)。所以在CPU設計領域,用戶可以下載RISC-V的源程序自己做處理器設計,也可以買SiFive等公司的授權來做設計。
RISC-V對中國市場非常重要,許多中國公司都在關注和投入RISC-V的芯片,希望芯片設計能夠有更多的本地化。除了很多大客戶,中國還有很多半導體初創企業,比如很多一些中國的新創公司去開發很先進的應用。
UltraSoC是業內唯一一家為RISC-V提供商品化開發環境的公司,包括監測、追蹤、調試CPU的運行,也可以用在完全開源的領域。他們也跟一些做RISC-V IP設計的公司有合作。因為他們的產品提供開發環境,有兩個層面,如果你完全從開源的做起,他們支持運行控制,追蹤和調試。也可以去,這里是全球最領先的幾家做智能駕駛、做RISC-V內核開發的公司。
最后,Microsemi最近也購買了UltraSoC的通用分析與嵌入式智能平臺授權,用于其基于RISC-V開源處理器架構的產品開發。
本文轉載自電子技術設計。
推薦閱讀: