针对Tenca-Todorov-Ko?提出的基为8,按字运算的Montgomery乘法器提出了一种改进方案。该方案在不增加硬件开销的基础上采用基为16的设计,相比Tenca-Todorov-Ko?的设计,平均性能提高26%。同时,在硬件上一方面通过调整数据通路以缩短关键路径延迟,达到时钟频率的提升;另一方面,在 FIFO 设计中对输入数据进行预处理,最终能节省一半的存储器开销。改进后的设计能应用于各种长度的模乘运算和RSA加密。最后,采用上述设计思想,基于0.25μm CMOS标准单元工艺,设计了一款2 048bit的RSA测试芯片。该芯片在125MHz的时钟频率下做一次2 048bit模幂的时间为28ms。