過去,設計工程師已在新系統的設計中采用信號完整性(SI, signal integrity)測試,以實現產品質量的穩定。盡管SI在工程原型(engineering prototype)階段非常有價值,但它并非萬能藥(panacea),隨著產品設計不斷深化,其價值實際上會變得越來越小。在早期原型除錯完成以后,需要通過一些具有溫度及電壓邊際測試(margin testing)功能的強大工具進行補充或替代SI測試,確保存儲器的產品質量穩定。
正確選擇存儲器設計、測量和驗證的工具,將減少工程時間,并增加檢測潛在問題的可能性。
產品開發的5個階段
調試實驗室沒有邏輯分析儀對設計和調試是不可思議的,然而,鑒于對成本和時間的考慮,邏輯分析儀很少成為檢測系統內故障或問題的首選工具,它們卻常用來調試由兼容性或4-角測試(4-corner)所檢測到的問題。產品開發包括5個階段:
階段1:設計
要在硬件設計中實現一個概念或思想,由于沒有現成的原型,只可采用仿真工具,因此,設計工程師只能依靠電及行為仿真工具來進行設計。
階段2:阿爾法原型
阿爾法原型(alpha prototype)是最初或較早的原型,它可能會在生產前就經過多次改變,其中包括:
(1)軟件更改,如BIOS、嵌入式軟件操作系統等。
(2)主要板改變,如阻抗大小和終端方式的改變等。
(3)功能改變,如ASIC、門陣列或FPGA;元件或包裝類型;修正非正確的功能等。
(4)氣流、電源、底板等。
阿爾法原型的目的是發現系統中的大多數或所有問題。設計工程師必須在阿爾法原型上進行足夠的測試以確保下一個原型,至少從硬件角度講,將接近生產就緒狀態。就這一點而言,可靠的工具將至關重要。
首先要采用的工具是啟動和軟件檢驗,由此可得出有價值的信息,這些信息與基本軟件檢驗相結合,從而指出需要加以改變的數據,由于基本硬件改變尚有可能,徹底的軟件檢驗或許尚不可行。
在這個階段SI測試起著重要作用,它捕獲線路板上線跡的模擬信號,這些捕獲可與仿真或器件規格進行比較來確定這一器件是否符合規格及有充足的時序裕量,否則,就必須對器件加以改進。然而,有一種在這個階段不應使用的工具是邊際測試,該測試只能在硬件完成后采用。在運行相應的測試后,設計工程師要進行一系列設計變更,包括可能要通過電或行為的仿真來確保設計達到所需的效果。
階段3:貝塔原型
在最后階段貝塔原型(Beta Prototype),硬件接近成品狀態,僅有一些很小的問題出現,組合測試可以確保系統處于生產就緒狀態,軟件或兼容性的測試必須徹底,這一測試可單獨執行或與邊際測試結合在一起執行,邊際測試的涵蓋范圍應當是廣泛的。不同的溫度與其極限電壓電平對識別這些問題及邊際時有價值,這一組合應捕獲可能出現的存儲器故障。
這種軟件測試對于除去如下所示的存儲錯誤來說是相當有用的:
(1)重新啟動或開機測試。
(2)存儲器測試方案,如檢測板、軟件版本等。
(3)影響存儲器性能的系統斷電或待機模式。
在這一階段SI測試的作用有限,但它可用于調試功能性的故障或確認在阿爾法原型階段所進行的改變。SI測試不應用于驗證來自未被改變的阿爾法原型的信號或網絡。假如在貝塔原型階段有任何補充性的修改,則有必要通過電和/或行為仿真或SI對這些修改進行確認。
階段4:生產
在生產階段很少對系統進行改變,這一階段的重點在于穩定產品質量,系統的生產或許需要幾個月甚至幾年,這一生產或許要用到數百或數千個元件,公司有一套穩定產品質量的程序顯得尤為重要。
在系統進入生產階段后對元件上進行一系列的質量測試,可以確保足夠的元件供應以使生產不致中斷。在生產階段,極少對母板的線跡和布局加以改變,由于SI測試已用于確認那些改變,在這一階段,SI測試不再必要。此外,SI測試不能捕獲以往由系統/存儲器相關的問題所造成的故障,首選的工具及穩定產品質量的關鍵是兼容性及邊際測試。
階段5:后期制作(post-production)
像MP3播放器或DVD錄音機這樣的系統在生產后段沒有穩定產品質量的要求,然而,其它的系統可能有存儲器升級或支持的要求,這一點在筆記本電腦、移動PC及其它器件中尤為常見,而且在生產后段的數年都很重要,邊際測試及兼容性測試成為穩定產品質量的關鍵。
信號完整性測試
電子設計工程師喜歡使用示波器觀察電路設計并評估信號。圖1顯示了一個典型的SI捕獲,在這一實例中,目標照片表明信號來自單個DDR同步動態隨機存取存儲器(SDRAM)組件:
(1)BA1——地址組1
(2)CS——芯片選擇信號
(3)CK——不同的系統時鐘
SI測試過程用系統信號的示波器光圖來評估電壓隨時間的變化,這些光圖或“捕獲”通過視覺來評價違規狀態,這種方法因對工程專家的水平提出高的要求,因而是一個耗時的過程。
借助于如圖1所示的SI測試圖,能夠發現很多游泳的信息,其中包括:
(1)振鈴、上沖/下沖(Ringing or overshoot/undershoot):JEDEC制定的存儲器元器件規范限制了允許的上沖/下沖數量。阿爾法原型階段的SI無法涵蓋這些規范中的時鐘沖突問題。
(2)時鐘沖突(Timing violations):通過這些波形很容易發現信號時鐘特性。
· 斜率:表明驅動信號的強弱。
· 設置及保持時間。
· 時鐘占空比。
· 不同信號(如CK和CK#)之間的串擾現象。
· 控制信號和數據信號之間的關系,以及它們是否滿足JEDEC規范?
· 總線爭用:是否存在兩個信號同時驅動一條總線?會不會引起沖突?
假如上述狀況中有任何一種出現,通過兼容性及邊際測試都能輕易發現系統故障,在這些問題被發現后,其它的工具(邏輯分析儀、SI測試等)能夠確定故障的原因。
SI分析的局限性
SI 分析正變得越來越困難并且消耗時間,在像FBGA封裝這樣的情況下,幾乎不可能進行SI分析,原因何在?
(1)FPGA封裝:除非探測點被增加到設計當中,在FBGA封裝中是不可能探測到信號的。有一些適合DDR2的方案,如Micron Snoop可以通過探針對信號進行測量。在除錯或產品設計段,這些方案可以提供很有價值的信息,但是開發成本也會增加。
(2)MCM封裝:在多芯片模組(MCM)封裝中,將各種不同的芯片組合在一個封裝內。這些封裝既可用鑄模化合物也可用密閉的方法加以保護,因此封裝內的信號無法被探測到。
(3)對信號質量的干擾:采用探測器來測量SI會改變正在被測量的信號。由于增加了電容會引入一些問題,或造成SI變化消失。盡管可采用有源或場效應晶體管(FET)探測器,這種狀況由于頻率升高變得越來越普遍,尤其在具有點對點結構的系統中。
(4)對于檢測很多存儲器問題無能為力:對于存儲器質量或穩定產品質量而言,SI測試有其局限性,Micron公司已在存儲器的多種內部質量測試時采用成百上千種SI示波器捕獲分析,得出如下結論:
· 在開發的初期采用SI測試能夠捕獲故障及識別重大錯誤。
· SI測試用于驗證板的改變。
· 板設計完成后,SI測試尚有一點價值。
克服SI測試的局限性
Micron公司的內部測試流已脫離SI測試,它由以下幾點組成:
· 兼容性及邊際測試用于確認或測試具有存儲器的系統。
· 在兼容性及邊際測試檢測到錯誤后,不同的診斷工具用于隔離這一故障。
· 假如軟件確定了系統中的故障類型(地址、行、單個單元等),存儲器芯片或模塊被隔離并被測試,然后我們會嘗試在存儲器測試夾具中復制這一故障狀態。
· 如果軟件不能提供有關故障的詳細資料,可將存儲器從系統中移開,然后進行組件或模塊測試來發現故障。
· 邏輯分析儀可用于確定故障問題/類型及違規情況。
盡管可采用示波器,經驗表明在迅速測量、確認和調試系統方面,其它的工具會更有效。我們相信這些替代工具使設計工程師能夠迅速地實現故障分析和排除。
Micron公司的自我質量控制流程得到如下結論:
· 定期的兼容性測試及邊際測試會暴露一些系統中出現的問題或困難。
· SI不能發現存儲器或系統級診斷所不能識別的任何問題,SI發現的是與其它測試所發現的相同的故障,因此重復了邊際測試及軟件測試的性能。
· SI測試很耗時,探測64位數據總線及俘獲目標示波器屏幕圖會消耗時間。
· SI采用昂貴的設備(示波器和探測器)
· 因需要高級工程師分析來評估目標信號的圖片,故而SI占用了寶貴的工程資源。
· SI測試不能發現所有的故障,兼容性及邊際測試能夠發現SI測試所不能檢測到的錯誤。
SI測試的替代方法
SI測試的替代方法被用于系統開發、存儲器質量控制和測試。
軟件工具或兼容性測試
計算機系統極適于軟件測試,因為計算機能夠利用現成軟件,所以可使用多種存儲器診斷工具。當選擇軟件工具時,應關注那些支持強大升級功能的工具,并選擇可與新的診斷工具相結合的程序,診斷工具用來捕獲以前所未知的故障機制。這些工具有:
• PC Doctor
• Winstress
• Quicktech
• RST Pro
• AMI Diag
• PC Certify
• Tuff Test
與PC不同,其它產品如消費電子、嵌入式及網絡產品的測試更加困難。針對這些應用類型,設計工程師開發專用工具或根本不使用上述工具。定制更為魯棒的專用工具能獲得比SI測試更多的益處。
值得注意的是:有時候在某些系統中不可能進行與存儲器規格有關的測試,如MPEG解碼或網絡數據包傳輸。在這些情況下,就應采用上述工具。
邊際測試
有兩類邊際測試尤其重要,它們能夠強迫系統暴露邊際和系統問題:電壓及溫度的強化測試。這兩類強化測試重點在于使DRAM和DRAM控制器暴露到可能顯示系統問題的狀態。
邊際測試允許時鐘和功率這些參數有點變化,以測試和強調系統的額定參數。作為典型的邊際測試,4角測試(4-corner test)已被證明為測試存儲器的最有效的方法之一,就測試時間和所需的資源而言,這種測試也是可行的。對于一個具有最小和最大電壓及溫度分別為3.0V和 3.6V及0°C和70°C的系統而言,這四個角是:
角1:最大電壓3V,最高溫度70°C
角2:最大電壓3.6V,最低溫度0°C
角3:最小電壓3.0V,最高溫度70°C
角4:最小電壓3.0V,最低溫度0°C
這些測試方法可能有點不同,但通常的程序是讓系統在某個溫度和電壓保持穩定,然后在點某一角上進行一系列的測試。如果出現故障,應對此加以分析。
另外一種是2角測試(2-corner test)。在某些系統中,輸入到存儲器的電壓可能由電壓調節器控制的,因此無法調節輸入到DRAM的電壓。在這種情況下,可采用最大(MAX)和最小(MIN)溫度測試或兩角測試。另外,還可以將輸入到電壓調節器上的電壓改變為MIN/MAX電平進行4角測試(4-corner test)。
另一邊際測試實例為多角測試(multicorner test),其依據為多個電壓和溫度測試點。該測試方法成本高,并且浪費時間。因此,4角測試(4-corner test)被證明為測試存儲器的最高效方法。同時,測試時間也短,所需資源也容易獲得。
功率周期測試 (power cycling test)
功率周期強化測試(power cycling test)反復開、關(重啟)系統,測試包括冷啟動和熱啟動測試。系統由未被運行狀態到進入環境溫度下的運行狀態的過程稱為冷啟動,當系統運行了一段時間且內部溫度穩定時進行的啟動為熱啟動。
在啟動或上電時,在可能出現錯誤的地方會發生一些獨特的事件:
(1)電源電壓爬升:電源供應電壓的升高只能通過反復進行功率周期測試發現。
(2)存儲器的初始化:為了滿足JEDEC和工業標準,存儲器控制器必須遵守初始化程序的限制。如果出現間歇性的問題,只有通過反復啟動才能檢測到。
自動刷新測試(Self Refresh Testing)
由于DRAM單元漏電,因此必須經常刷新,以便保持正常操作。在DRAM系統中,節省耗電的一個關鍵方法是在存儲器很長一段時間未用后,在非讀寫狀態進行自動刷新。特別要注意的是,當進入和退出自動刷新狀態時,要保證存儲器控制器提供正確的命令,否則可能會丟失數據。
與功率周期類似,自動刷新周期非常有用。如果出現某種間歇性的自動刷新進入或退出問題,重復這一周期有助于檢測到這些問題。不采用自動刷新的應用應避免這種測試。
小結
存儲器及其它組件間接口中的系統級問題可能是細微且難以覺察的,在適當的時間,采用正確的工具可使設計工程師很容易地識別出潛在的問題并增加設計的魯棒性。
重新評估邊際測試和兼容性測試,尤其是在內存質量控制或確認過程中的作用,會大大減少存儲器質量控制工程開發的時間,并對實際故障有更有效和全面的認識,從而加快存儲器質量控制的過程,尤其在穩定質量方面,這些就是使用上述測試帶給你的主要回報。
詳細閱讀TN-00-20: Understanding the Value of Signal Integrity,請訪問http://download.micron.com/pdf/technotes/TN0020.pdf。