RSA算法的TMS320C54x DSP實現
摘要:RSA算法是基于數論的公鑰密碼體制,是公鑰密碼體制中最優(yōu)秀的加密算法。本文介紹RSA算法的基本原理以及用以TMS320C5402芯片為核心的硬件去實現RSA算法;提供了應的硬件、軟件的接口設計,取得了較好的安全性和速度性能。
關鍵詞:DSP RSA算法 公鑰密碼體制 模運算
引言在當今的電信時代,由于采用大規(guī)模的電子計算機對數據進行處理,使得信息的傳遞大大加速,但是,也隨之出現了令人最為擔心的問題,就是信息的安全性。對信息進行保護的方法就是數據加密,通過對網絡上傳輸的數據和系統(tǒng)內存儲的數據進行加密,可以大大提高網絡和信息的安全性。以較高的安全性而被廣泛采用的RSA公鑰密碼體制,在現代安全性制中占有重要地位。RSA算法由于在加密和解密過程中要進行大量的數值運算,存在難以實現的問題;而采用純軟件的方式實現RSA算法,雖然降低了解密的強度,但卻增加了運算時間。本文采用一種軟硬件相結合的方式來實現RSA算法。
DSP(Digital Signal Processor)芯片,即數字信號處理器,是一種特別適用于進行實時數字信號處理的微處理器。TMS320C54x系列是一種有特殊結構的微處理器,其內部采用程序與數據分開的哈佛結構;具有專門的硬件乘法器,廣泛采用流水線操作,使用特殊的DSP指令,可以用來快速地實現各種數字信號處理算法。正因為TMS320C54x系列的這些特點,比較適合RSA算法使用,實現對串行數據的加、解密。
1 RSA算法RSA算法是由Rivest、Shamir與Adleman三人于1978年合作開發(fā)的,并以他們的名字命名的公開密鑰算法。其加密密鑰是公開的,而解密密鑰是保密的。它是基于一個非常簡單的數論思想:“將兩個素數乘起來是很容易的,但是分解該乘積是非常困難的”。
RSA算法的特別為利用素數(也就是質數)的因式不可分解性,選用很大的素數(一般為幾百位到幾千位),為了使政府部門與軍事部門的數據保密,大多采用幾千位以上的素數作為加密的密鑰。RSA算法的要點與難點有二:①算法主要為求模取余運算,這給此算法的應用增添了實際的應用難度,因為給一個幾千位的素數進行求模取余運算是很難的;②判斷一個數是否為素數也是數學界幾百年來一直討論與研究證明的難題,雖然費馬提出了著名的“費馬猜想”,但一直卻未得到過完全的證明,基于此要找一個幾千位的素數更是難上加難。
(1)RSA算法原理
RSA算法是基于數論中的同余理論。如果用m代表明文,c代表密文,E(m)代表加密運算,D(c)代表解密運算,x=y(mode z)表示x和y模z同余,則加密和解密算法簡單表示如下:
加密算法 c=E(m)=me(mod n)
解密算法 m=D(c)=cd(mod n)
其中n和密鑰e是公開的,而密鑰d是保密的。
下面討論密鑰的求?。?BR> ①選取兩個隨機大素數p和q(保密);
②設n=p×q;
③歐拉函數φ(n)=(p-1)(q-1)(保密);
④選取與φ(n)互素的正整數e,即滿足gcd(φ(n),e)=1和0<e<φ(n);
⑤計算d(保密),使?jié)M足e×d=1(mod φ(n)),即d和e相對于模φ(n)互為逆元素。
由RSA算法原理可知,RSA算法的核心是求模取余運算,其安全性是建立在大合數因子分解困難的基礎之上的。
(2)模運算的實現
RSA算法的核心操作也是最耗時的操作是模運算,所以開發(fā)一種快速指數和取模運算是解決運算速度的關鍵。通常的模運算都是利用加減法來實現的,因為加減法指令的執(zhí)行速度快。但對于TMS320C54x系列芯片,內部有專用的17位×17位乘法器,使得乘法指令的執(zhí)行與加減法指令的執(zhí)行所用的時間完全相同,所以在此設計中采用乘法完成模運算。
在進行模運算時,一般先將指數e(長度為kbit)改寫成二進制數組的形式e,即
其中:ei∈{0,1},i=0,1,Λ,k-1。
這樣,在計算me(mod n)時,先做一次平方運算,然后根據ei的值,再做一次乘法運算,以此來簡化模運算的復雜性。
由于實際中的e值非常大,為了提高運算速度,可以將e進行分組后運算。設對e以四位一組(十六進制)的形式計算me(mod n),那么: