一、基于矩阵初等变换的矩阵分解法(论文文献综述)
杨永舟,黄秀琼[1](2021)在《基于HLS的复数矩阵QR分解求逆算法的实现与优化》文中研究说明针对阵列信号实时处理系统中的各类矩阵求逆模块设计存在程序状态机转换复杂,时序调试困难,可扩展性弱等问题,提出一种基于HLS(High Level Synthesis)实现的QR分解求逆的程序算法和流水线结构的Housholder变换模块,并实现和优化该算法,封装成一种满足高速计算、资源消耗少,可自定义配置阶数等要求的大型复矩阵求逆IP。最后对RTL的综合结果从时序延迟、资源消耗、程序可配置性等方面进行分析,根据综合结果表明,该IP可以在64阶复矩阵的条件下,将模块速度提高至2ms的量级,并实现可配置阶数、高数据精度等优点,很好满足了实际工程中对实时性要求高的需求,并能灵活配置在各类型FPGA开发平台中。
陈文杰[2](2021)在《高速高精度矩阵求逆器的设计与实现》文中指出随着技术的发展和应用需求的提升,神经网络、数字信号处理、无线通信技术等领域中涉及到大量高精度浮点数运算。而矩阵运算作为信号处理的基础运算在各个领域中得到广泛应用。求逆运算是矩阵运算中最复杂的运算。传统的求逆算法由于运算复杂度过高,过程复杂不利于硬件实现。因此,国内外大量研究团队提出了一系列矩阵求逆的方法,并在硬件上进行验证和实现。矩阵求逆运算的运算复杂度与阶数三次方成正比,现有的矩阵求逆器的面向对象大多数为一些基于定点数的特殊矩阵或者定规模矩阵。因此,设计一款面向高精度高维度的硬件矩阵求逆器具有十分重要架构探索意义和工程实用价值。综上所述,本文在深入研究了现有矩阵求逆算法和硬件实现架构,开展了以下主要工作:(1)对现有矩阵求逆算法进行分析和探究,根据算法本身的运算复杂度,硬件实现复杂度和数值稳定性等特点,选取基于按列Givens旋转的矩阵分解算法,并在其基础上综合使用原位替换的并行Column-wise Givens Rotation(CGR)分解方法,和分块求逆的上三角矩阵求逆方法,充分发挥算法并行特性,确保实际电路性能。(2)根据CGR算法的特性,设计了矩阵求逆运算的硬件加速器,用于加速双精度浮点方阵的求逆。在矩阵的QR分解过程中,优化二维脉冲阵列结构,设计了一维线性结构,该结构充分发挥了CGR算法的流水化计算过程特征,压缩了分解过程中的运算周期。(3)按照标准ASCI流程完成了仿真验证、综合实现、后端优化以及版图实现,最后在Xlinx XC7V440T FPGA平台上搭建验证环境并验证。实验结果表明,本文设计的矩阵求逆器可支持任意2-32阶的双精度浮点数矩阵求逆运算,在TSMC28nm工艺下,该求逆器支持工作频率为700MHz,芯片面积为1.08mm2,可在14123个周期内完成32阶双精度浮点矩阵求逆运算,计算结果与MATLAB的平均相对误差在10-8以下,频率归一后其性能是AMD Ryzen 5 3500U CPU的40倍,面积归一后性能是NVIDIA RTX3070 GPU的118倍。
张大明,李璐,刘华勇,张学勇,王焕宝[3](2020)在《面向几何直观和计算思维的线性代数混合式教学方案》文中研究表明提出一种面向几何直观和计算思维的线性代数课程混合式教学方案.新的混合教学模式可以在线性代数中培养学生的几何直观能力和计算思维能力,既有利于教师持续提高教学水平,也有利于学生提高信息化学习能力和自我思考能力.
秦冀河[4](2020)在《高阶浮点矩阵运算IP设计与验证》文中研究指明矩阵理论和算法可以用来解决实际工程项目中的诸多问题,这些工程领域通常有数字信号处理、高速网络信息传输、信息加密和图像处理等,矩阵运算在这些大规模数据分析领域中具有广泛的应用价值。而且在系统中往往需要进行实时性运算,其执行效率对于整个系统的运行有至关重要的影响。随着现代科学和工程问题的日益复杂,往往需要求解大型线性方程组,矩阵作为一种数学工具在其中的作用日益突出,常用的矩阵运算有加法、减法、乘法、除法、求逆、转置等运算。其中在工程应用领域实现难度较大的主要是求逆运算,而目前的矩阵求逆器的特点主要有耗费时间长、占用硬件资源大等特点,为了改进现状,亟需设计一种可处理双精度浮点型数据的高阶矩阵求逆器作为硬件加速器的实现方式,同时也要使用适中的硬件资源来完成矩阵求逆器的设计过程。论文的主要工作如下:1.在深入研究对角占优矩阵的特点和矩阵求逆运算的基础上,对比分析了国内外相关技术文献所提出的解决方案,得出主要结论为针对高阶矩阵采取直接求逆难度较大,需要对其进行分解后求逆,该过程涉及到矩阵分解与三角矩阵求逆的多种运算方法,经过对比其适用范围、算法原理与在实际工程中实现的难易程度后,最终选定使用LU矩阵分解算法作为矩阵求逆运算过程中的关键步骤,LU矩阵分解广泛应用于许多工程领域,旨在解决线性系统方程等实际应用,而经过LU分解后所得到的两个三角矩阵在求逆运算时选定使用初等行变换法,初等行变换法适用于任意阶数的矩阵,具有较好的灵活性。2.基于硬件加速器可以执行特定应用程序从而提高处理数据能力的思想,通过系统总线连接到处理器的方式,完成设计了一款可配置阶数的矩阵求逆器,其中包括:存储模块、运算模块、地址控制模块等,重点针对矩阵运算过程中的分解、三角阵求逆、乘法运算所涉及的地址控制模块进行详细说明。由于LU分解过程、三角阵求逆过程与矩阵相乘过程中均涉及乘累加运算,因此多次复用乘累加单元,从而降低了硬件资源的开销,节约芯片的面积。3.完成了逻辑综合,各项结果满足设计要求;完成可配置阶数矩阵求逆器的仿真验证,通过MATLAB生成符合特定要求的随机矩阵作为激励输入待测设计中,再将设计的结果输出后与MATLAB对矩阵求逆所得结果进行相减,若结果在误差允许范围之内则说明本求逆器功能正确,得出本求逆器计算结果精度达到10-5,之后对其误差进行分析,得出的结论为:在同一阶数矩阵下,求逆结果的最大误差和平均误差随着矩阵元素数量级的增大而逐渐减小;而求逆结果的误差会随着矩阵阶数的增多而变大。完成硬件资源占用分析,并与同类型文献在性能方面进行对比。测试结果表明,本文完成的可配置阶数矩阵求逆器在处理最大30阶矩阵时,仅需要10398个时钟周期,满足设计要求,且与同类型的矩阵求逆器相比本求逆器具有更快的运算效率和较低的存储资源。
邱俊豪[5](2020)在《高速高精度矩阵运算器的设计与实现》文中指出随着大数据时代的到来,人工智能、云计算等新兴技术被广泛使用,现代数字信号处理系统需要实时处理高维度、高精度以及高带宽的复杂信号。矩阵运算作为信号处理系统的重要基础运算,有着广泛的应用。其中矩阵求逆是最复杂也是应用最广的运算之一,受到国内外学者重点关注,提出了大量有效的矩阵求逆算法,并通过不同的硬件平台进行了验证与实现。矩阵求逆的运算量随矩阵规模的增大呈指数增大,而硬件实现的资源有限。故常见的矩阵求逆多以特殊矩阵或者小规模矩阵为对象,用于大规模任意矩阵求逆的方法及其硬件实现的研究较为少见。在当今时代背景下,大规模非奇异矩阵求逆是数字信号处理中极具挑战且不可避免的课题之一,具有重要的现实意义与工程价值。针对上述问题,本文对矩阵求逆算法以及其硬件架构设计进行了深入研究。主要内容如下:(1)分析研究矩阵求逆的各类算法,根据数值稳定性、运算复杂度以及硬件实现难度等因素,选定基于Givens-QR分解的矩阵求逆算法。然后,根据算法的运行特性,设计了基于原位替换的混合粒度并行Givens-QR分解算法和上三角矩阵求逆的分块递归算法,充分挖掘算法的运算并行度。(2)根据优化的求逆算法,设计了以矩阵求逆为核心的矩阵运算硬件加速器。论文在二维脉动阵列结构的基础上设计了一种一维线性流水结构,有效压缩运算资源。运算器可以直接加速2-32阶双精度浮点矩阵求逆,兼容了线性矩阵运算、矩阵阵乘以及矩阵转置操作。(3)完成矩阵运算器的全部前后端设计工作,并在Xilinx XC7V2000T型FPGA平台上搭建验证环境并完成验证。结果表明,本文设计的矩阵运算器在TSMC28nm工艺下,工作主频700MHz,芯片面积为2.25mm2,能够完成全部预定矩阵运算功能,其中32阶双精度浮点矩阵求逆耗时14910个周期内,计算精度达到10-15,其速度是NVIDIA RTX2070 GPU的140倍。
江传民[6](2020)在《空域自适应抗干扰算法研究与实现》文中提出为了满足用户移动数据流量的日益增长需求,第五代移动通信技术已经正式商用并逐渐普及。相比于4G通信系统,5G通信系统在基站侧使用大规模的天线阵列替代之前的多天线结构,由此可以极大地提高系统的用户容量和频谱效率,降低系统的功率能耗比。然而,随着用户数目的快速增长,热点区域内用户与用户之间的干扰将会极大的影响通信质量,降低系统的稳定性与可靠性,进而影响用户的使用体验与系统的整体性能,而基于阵列天线的自适应抗干扰算法是解决上述问题的途径之一。自适应抗干扰技术一直是通信系统的热门研究课题,广泛应用于雷达、声呐、遥控、移动通信等领域。本文根据5G通信系统基站侧使用天线阵列的硬件结构特点,旨在将自适应抗干扰算法应用至5G通信系统中以提高系统的抗干扰能力,主要工作如下:1)详细阐述了阵列天线的理论基础,简要介绍了自适应阵列天线的系统结构,并对常见的几种自适应波束形成准则进行了推导,分析比较了这几种准则的应用环境与前置条件;2)对自适应波束形成技术中的最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)算法和空间谱估计中的多重信号分类(Multiple Signal Classification,MUSIC)算法进行了理论研究与仿真分析,结合算法的适用情况,提出使用MUSIC算法对信号方位进行实时的精确检测以保证MVDR算法对期望信号的无失真接收和对干扰信号的有效抑制。此外,结合实际工程应用,针对上述算法中复杂度较高的矩阵求逆与矩阵特征值分解部分,本文提出使用LU分解与Cholesky分解实现矩阵求逆,使用二阶主子式实数对角化实现矩阵特征值分解,降低了算法的复杂度与硬件实现时的资源消耗,加快了算法运行速度;3)使用FPGA开发软件System Generator和Vivado HLS,对MVDR算法与MUSIC算法完成了工程实现与仿真验证,并经过对这两种开发软件的对比分析,提出将复杂度高、需要灵活配置参数的算法部分使用Vivado HLS进行开发,将数字信号处理部分使用System Generator进行开发,充分结合两种开发软件的优势,简化了阵列信号处理算法的FPGA开发流程,大大缩短了整体工程实现的开发周期;4)基于软件无线电硬件平台USRP、集成FPGA芯片的抗干扰射频组件和均匀一维超宽带天线阵列,搭建了一套通信自适应抗干扰系统,该系统充分考虑了MUSIC算法与MVDR算法各自的优点与不足,将MUSIC算法用于对信号源方位的精准测定,在得到信号准确方位信息后递送至MVDR算法中从而实现对目标信号方位无失真的接收,并同时对干扰信号进行有效抑制。经过实验测试表明,整套通信系统对干扰信号的抑制能力达到20d B以上,具有良好的自适应抗干扰性能。
陈宗泽[7](2019)在《大规模矩阵求逆运算电路设计与优化》文中指出矩阵运算是科学计算与工程计算中的基本问题,在信号处理领域中有着广泛的应用。其中矩阵求逆运算占有相当重要的地位。在大规模MIMO系统、阵列信号处理以及图像信号处理等场景中,随着数据规模呈几何级数增长,矩阵求逆的运算速度往往成为影响系统性能的关键。因此,本文主要针对大规模矩阵求逆问题,设计单精度浮点数的高阶实矩阵求逆硬件加速电路,提高矩阵求逆运算电路的吞吐率。本文首先通过对多种矩阵求逆算法的适用性、计算复杂度、以及硬件实现难度等角度的对比分析,选择基于Cholesky分解的矩阵求逆算法进行硬件实现;为了实现电路的高吞吐率,采用流水线并行结构作为本文电路设计的架构基础。基于Cholesky分解的矩阵求逆算法将矩阵求逆过程分为Cholesky分解、下三角矩阵求逆以及三角矩阵相乘三个步骤。本文通过分析三个步骤的数据依赖关系,分别对Cholesky分解、下三角矩阵求逆以及三角矩阵相乘进行基于线性PE阵列的细粒度并行任务划分,并以此为基础设计了PE单元,通过优化阵列结构减少了大量硬件资源使用。其中,针对下三角矩阵求逆,提出了按列进行任务分配的计算方式,通过转换计算顺序实现下三角矩阵求逆算法的并行执行,并通过对浮点乘累加器的设计进一步提高了吞吐率。本文将三个步骤的电路模块进行了整合,实现了最高5120阶矩阵求逆电路系统,误差精度在10-710-4范围内,满足信号处理的基本需求。最后本文根据算法执行过程以及电路延时等参数信息建立了大规模矩阵求逆系统的性能验证模型,从理论上对矩阵求逆电路进行性能分析,加快了对该类电路的性能分析速度。本文采用Nexys Video平台进行验证。结果表明:本文所设计的大规模矩阵求逆系统在FPGA片内集成32个PE单元的情况下,最高支持时钟频率为156MHz,吞吐率达到8.2GFLOPS,可支持325120阶矩阵的求逆运算。相比同类单精度浮点高阶矩阵求逆电路,在节省了20%以上硬件资源情况下吞吐率提高了4%。本文设计的电路满足了大规模矩阵求逆运算的需求,具有一定的工程应用价值。
唐小芳[8](2019)在《基于FPGA的高光谱目标检测算法实现》文中指出高光谱目标检测技术一直以来就是高光谱图像处理领域的研究热点之一,而高光谱图像庞大的数据量以及高维的数据特征使得目标检测算法的硬件实现成为技术难题,这影响了高光谱图像目标检测的发展。然而,随着检测算法的优化和检测平台的进步,尤其是现场可编程门阵列(FPGA)的发展,使得许多图像处理算法可以通过硬件来实现。FPGA包含大量的存储和逻辑资源,能处理的数据规模不断增长。而且其具有高速、低功耗和高可靠性等优点,在高光谱图像处理领域占据很重要的地位。本论文基于FPGA硬件开发平台实现高光谱目标检测算法,由于OSP算法对图像数据进行目标检测时不依赖于数据的统计模型,并且可以直接从线性混合模型中推导得到,因此本论文采用OSP算法作为待实现的目标检测算法。论文首先对OSP算法进行硬件系统设计,自上而下将整个系统划分为干扰光谱特征矩阵相乘模块、矩阵求逆模块、检测算子运算模块以及检测量运算模块。进而对每个模块运用Verilog HDL语言进行设计描述,使用Modelsim软件完成各个模块和系统的功能仿真,并给出了对应的仿真结果。之后,使用MATLAB软件对算法硬件实现系统输出的检测量进行读取显示,采用ROC曲线评估系统的检测性能。并与基于MATLAB软件实现的算法检测结果进行对比,验证系统的正确性。其次,由于OSP算法中矩阵求逆部分在硬件实现中比较复杂,占用资源数较多,而改进的ROSP算法的计算相对简单,因此进一步研究了基于FPGA的ROSP算法的硬件实现系统,给出了系统的整体设计方案和每一个模块的具体设计方法,通过编译仿真,给出系统的目标检测结果。之后,读取、分析ROSP算法硬件实现系统的结果,验证系统的功能,并与OSP算法实现系统进行比较。本文基于FPGA实现的高光谱目标检测OSP算法实现系统和ROSP算法实现系统均较好的完成了高光谱图像中感兴趣目标的检测,OSP算法实现系统速度更快,而ROSP算法实现系统消耗的逻辑资源更少。
叶紫燕[9](2019)在《高适用性大维度矩阵求逆器的算法优化和实现》文中认为随着现代科学研究中云存储、云计算和云物联等技术的不断发展,相关的数据信息也呈现出爆炸式增长。矩阵类运算在海量数据的存储和计算中占比越来越大,矩阵求逆是其中最复杂的运算之一。国内外的学者们在不断研究探索后提出了众多有效的矩阵求逆算法,并在不同的硬件结构上得到验证与实现。求解逆矩阵的计算量庞大,硬件实现时受资源因素制约。常见矩阵求逆多以小矩阵或者特殊矩阵为对象,适用于大规模任意矩阵求逆方法研究较少,对于硬件实现更加罕见。大规模矩阵直接求逆被认为是其中最具挑战性问题之一,且不可规避。因此,探索大规模非奇异矩阵求逆的硬件实现具有重要的现实意义。本文针对上述问题,进行了有关大规模非奇异矩阵求逆算法和硬件结构设计的研究。主要工作内容如下:(1)研究分析了典型的矩阵求逆算法、适用性及运算复杂度,选择了基于LU分解的原位替换求逆算法。对原位替换矩阵求逆算法的计算公式进行修正,提出一种改进的大维度矩阵求逆算法。新算法通过主元交换和行修正操作,将应用范围扩展至非奇异矩阵,克服了既有原位替换算法适用矩阵类型有限的缺点。(2)根据新算法的运算特征,设计大维度任意阶矩阵求逆器的硬件方案。该设计延续了“原位替换”存储结构上的优点,并且采取多路并行和运算器分时复用的策略提高运算速度。(3)完成硬件实现,并在Xilinx公司FPGA芯片上进行功能验证和性能测试。硬件实测结果表明,本文设计可在332K个周期内完成128阶单精度浮点非奇异矩阵求逆任务,结果精度达10-5。
曹麟[10](2019)在《基于线条追踪的并行化视觉里程计设计与实现》文中进行了进一步梳理近年来,随着科学技术的迅猛发展,人工智能、无人驾驶和增强现实等技术已经在人们的生活中成为了现实,甚至成为人们生活中必不可少的一部分。这些技术的应用需要传感器实时感知自身在空间中的位置以及周围环境的三维结构。综合考虑系统价格和易扩展等因素,基于视频序列的定位与环境感知系统应用较为广泛。在即时定位与地图构建(Visual Simultaneous Localization and Mapping,简称V-SLAM)系统中,负责相机定位的视觉里程计(Visual Odometry,简称VO)设计方案是非常重要的。视觉里程计包括前端与后端两部分,前端主要负责相机运动追踪与地图点定位,后端负责消除由前端带来的累积误差,并计算最优的局部地图。目前,主流的视觉里程计前端和后端设计均存在一些缺陷。基于特征点法的视觉里程计前端主要存在无法实时构建半稠密乃至稠密地图的缺点;由于特征点所包含的语义信息较少使得误配的问题容易出现并且特征点的匹配会耗费大量的计算资源。视觉里程计后端的地图点优化计算也存在冗余,并且V-SLAM系统在跨平台使用时,优化库的使用也面临配置环境和安装相关库等诸多不便。在研究现有视觉里程计的主流算法基础上,针对前端和后端存在的问题,本文提出了一种基于并行化线条追踪的视觉里程计设计方案。通过研究采样点的分布对直接视觉里程计精度的影响,设计了以线条中的特征点为采样点,利用特征点法求解相机粗位姿,再使用粗位姿为初始值进行并行化线条追踪的方案。该方案不仅可以实现稳定的相机定位和解决视觉里程计后端跨平台时面临的问题,也充分利用了图像中线条的语义信息和多核计算机的多线程优势,从而加速视觉里程计的定位。具体来说,论文的主要贡献如下:(1)前端方面,本文提出了一种基于LK光流法的单目并行化线条追踪算法,在相机运动速度较小的情况下,该算法可以实现线条的准确匹配。由于光流法的局限性和物体遮挡导致线条形状发生变换,在相机运动速度较快的情况下,无法成功追踪。(2)提出了双目与深度相机的线条追踪改进方案。双目方案可以实时构建半稠密的深度图,RGBD方案既可以获得线条更精准的匹配又可以同时获得相机的位姿。(3)后端方面,本文提出了七步并行算法并给出算法推导过程,该算法不仅可以避免使用通用型优化库,实现更便捷的跨平台方案,还可以采用并行化的计算方法,加快后端优化的速度。(4)设计并实现了基于线程池的并行化直接-特征点混合深度视觉里程计,该方案较特征点法具有更好的稳定性且较直接法有更好的准确性,并且在开启线程池的情况下算法的速度有较明显的提升。
二、基于矩阵初等变换的矩阵分解法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于矩阵初等变换的矩阵分解法(论文提纲范文)
(1)基于HLS的复数矩阵QR分解求逆算法的实现与优化(论文提纲范文)
0 引言 |
1 QR分解原理与计算复杂度 |
2 基于Householder变换的QR分解 |
2.1 Householder变换原理 |
2.2 基于Householder变换的QR分解求逆原理 |
2.3 三角矩阵R求逆原理 |
2.4 酉矩阵Q求解原理 |
3 矩阵求逆程序模块架构设计 |
4 HLS程序优化设计 |
4.1 HLS工具的特点 |
4.2 HLS程序算法程序优化设计 |
5 程序测试与综合结果 |
6 结语 |
(2)高速高精度矩阵求逆器的设计与实现(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 课题来源 |
1.4 主要工作内容 |
1.5 论文结构 |
第二章 矩阵求逆介绍 |
2.1 矩阵求逆运算 |
2.1.1 矩阵求逆方法介绍 |
2.1.2 矩阵求逆方法对比 |
2.1.3 三角矩阵求逆方法 |
2.2 矩阵求逆算法优化 |
2.2.1 基于CGR(Column-wise Givens Rotation)翻转的QR算法 |
2.2.2 上三角矩阵求逆算法优化 |
2.2.3 矩阵乘优化 |
2.2.4 优化分析 |
2.3 线性矩阵求逆分析 |
2.3.1 线性矩阵分析 |
2.4 本章小结 |
第三章 高速高精度矩阵求逆器的硬件实现 |
3.1 矩阵求逆器硬件实现介绍 |
3.2 矩阵求逆器的硬件架构和工作流程 |
3.2.1 硬件架构 |
3.2.2 矩阵求逆器的工作流程 |
3.3 控制逻辑单元设计 |
3.4 不可逆矩阵判断单元设计 |
3.4.1 线性矩阵判断 |
3.5 CGR分解单元设计 |
3.5.1 细粒度并行结构介绍 |
3.5.2 基于Givens-QRD算法的二维脉动阵列分解结构介绍 |
3.5.3 基于CGR-RD算法的一维分解结构介绍 |
3.6 矩阵乘和三角矩阵求逆设计 |
3.7 存储单元及存储规则设计 |
3.8 地址生成单元及地址规则设计 |
3.8.1 源矩阵存储地址规则 |
3.8.2 CGR-QR分解地址规则 |
3.8.3 上三角矩阵求逆地址规则 |
3.8.4 矩阵阵乘地址规则 |
3.9 交叉开关设计 |
第四章 矩阵求逆器的验证与性能分析 |
4.1 验证方案 |
4.2 MATLAB算法验证 |
4.3 UVM验证 |
4.3.1 UVM简介 |
4.3.2 验证平台框架 |
4.3.3 验证平台搭建 |
4.3.4 代码覆盖率收集 |
4.4 硬件验证 |
4.4.1 ASIC验证版图 |
4.4.2 硬件资源分析 |
4.4.3 不可逆矩阵测试 |
4.4.4 误差分析 |
4.4.5 运算周期分析 |
4.5 性能分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(3)面向几何直观和计算思维的线性代数混合式教学方案(论文提纲范文)
1 几何直观教学实践 |
1.1 从二维、三维的几何意义出发使学生领会教学内容的本质 |
1.2 利用正交变换保持图形几何性质不变的特性,解决复杂的二次曲面(线)形状问题 |
2 计算思维教育 |
2.1 定义法(待定系数法) |
2.2 伴随矩阵法 |
2.3 初等变换法 |
2.4 矩阵分解法LU |
3 结论 |
(4)高阶浮点矩阵运算IP设计与验证(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 论文研究意义 |
1.2 国内外研究现状 |
1.2.1 矩阵算法的国内外研究现状 |
1.2.2 矩阵运算电路架构的国内外研究现状 |
1.3 矩阵求逆实现方法 |
1.3.1 硬件加速方法 |
1.3.2 IP核复用技术 |
1.4 研究内容与论文结构 |
1.4.1 研究内容 |
1.4.2 论文结构 |
第二章 双精度浮点数据的矩阵算法 |
2.1 双精度浮点数据的矩阵分解算法 |
2.1.1 LU矩阵分解法 |
2.1.2 QR矩阵分解法 |
2.1.3 Cholesky矩阵分解法 |
2.1.4 奇异值分解法 |
2.1.5 矩阵分解算法的比较 |
2.2 双精度浮点数据的矩阵求逆算法 |
2.2.1 初等行(列)变换法求逆 |
2.2.2 伴随阵求逆法 |
2.2.3 分块矩阵求逆法 |
2.2.4 矩阵求逆算法的比较 |
2.3 矩阵相乘算法 |
2.4 本章小结 |
第三章 基于AXI总线双精度浮点数据高阶矩阵求逆器设计 |
3.1 设计目标 |
3.2 总体架构及流程设计 |
3.3 矩阵LU分解模块设计 |
3.4 矩阵存储模块设计 |
3.5 矩阵求逆模块设计 |
3.5.1 L矩阵求逆设计 |
3.5.2 U矩阵求逆设计 |
3.6 矩阵相乘模块设计 |
3.7 矩阵求逆器接口设计 |
3.7.1 AXI接口设计 |
3.7.2 矩阵运算AXI配置信息 |
3.8 本章小结 |
第四章 双精度浮点高阶矩阵求逆器的仿真验证与结果分析 |
4.1 逻辑综合与结果分析 |
4.2 仿真验证与结果分析 |
4.3 性能验证与对比分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
作者简介 |
(5)高速高精度矩阵运算器的设计与实现(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 主要工作内容 |
1.4 课题来源 |
1.5 论文结构 |
第二章 矩阵运算介绍 |
2.1 矩阵运算算法分析 |
2.2 矩阵求逆运算 |
2.2.1 矩阵求逆方法介绍 |
2.2.2 矩阵分解算法分析 |
2.2.3 三角矩阵求逆 |
2.3 非求逆矩阵运算 |
2.3.1 线性矩阵运算 |
2.3.2 矩阵阵乘 |
2.3.3 矩阵转置 |
2.4 矩阵运算算法优化 |
2.4.1 基于原位存储的混合粒度并行Givens-QR分解算法 |
2.4.2 三角矩阵的分块递推求逆 |
2.4.3 其余矩阵运算优化 |
2.4.4 优化算法分析 |
2.5 本章小结 |
第三章 矩阵运算器的硬件设计与实现 |
3.1 矩阵运算器硬件实现设计 |
3.2 矩阵运算器的硬件架构与工作流程 |
3.2.1 矩阵运算器的硬件架构 |
3.2.2 矩阵运算器的工作流程 |
3.3 控制逻辑单元设计 |
3.4 可重构运算单元设计 |
3.4.1 Givens-QR分解运算单元设计 |
3.4.2 三角矩阵求逆及矩阵阵乘运算单元设计 |
3.4.3 其余矩阵运算计算单元设计 |
3.5 存储单元及存储规则设计 |
3.6 地址生成单元及寻址规则设计 |
3.6.1 源矩阵存储地址跳变规则 |
3.6.2 Givens-QR分解地址跳变规则 |
3.6.3 上三角矩阵求逆地址跳变规则 |
3.6.4 矩阵阵乘地址跳变规则 |
3.6.5 其余矩阵运算地址规则 |
3.7 交叉开关设计 |
3.8 外部接口设计 |
3.8.1 AXI接口设计 |
3.8.2 AXI配置信息 |
3.9 本章小结 |
第四章 矩阵运算加速器的验证与性能分析 |
4.1 验证方案 |
4.2 Matlab模型验证 |
4.3 硬件验证 |
4.3.1 验证流程以及ASIC版图 |
4.3.2 资源占用分析 |
4.3.3 运算误差分析 |
4.3.4 运算周期分析 |
4.4 性能分析 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(6)空域自适应抗干扰算法研究与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 本文主要内容与组织结构 |
第二章 阵列天线基础理论 |
2.1 阵列天线基本原理 |
2.1.1 阵列天线模型 |
2.1.2 阵列方向图 |
2.1.3 栅瓣和阵元间距 |
2.1.4 波束宽度和瑞利限 |
2.1.5 自适应阵列天线的系统结构 |
2.2 自适应波束形成准则 |
2.2.1 线性约束最小方差准则 |
2.2.2 最小均方误差准则 |
2.2.3 最大信干噪比准则 |
2.2.4 三种准则比较与等价分析 |
2.3 本章小结 |
第三章 自适应抗干扰算法理论分析与仿真 |
3.1 基于LCMV准则的MVDR算法理论分析与仿真 |
3.1.1 MVDR算法基本原理 |
3.1.2 MVDR算法仿真分析 |
3.2 MUISC算法理论研究与仿真分析 |
3.2.1 MUSIC算法的基本原理 |
3.2.2 MUSIC算法与MVDR算法的对比 |
3.2.3 MUSIC算法仿真分析与对比 |
3.3 基于Hermitian协方差矩阵的矩阵求逆研究 |
3.3.1 矩阵分解的意义和基本方法 |
3.3.2 基于Hermitian矩阵求逆方法的基本研究 |
3.4 基于Hermitian协方差矩阵的特征值分解研究 |
3.4.1 特征值分解算法研究背景与历史 |
3.4.2 二阶主子阵实数对角化特征分解算法原理 |
3.4.3 二阶主子阵实数对角化特征分解算法仿真与复杂度分析 |
3.5 本章小结 |
第四章 自适应抗干扰算法工程实现 |
4.1 FPGA与Xilinx概述 |
4.1.1 FPGA概述 |
4.1.2 硬件开发平台 |
4.1.3 软件开发平台 |
4.2 MVDR算法工程实现 |
4.2.1 MVDR算法的System Generator实现 |
4.2.2 MVDR算法的HLS实现 |
4.2.3 两种实现方式对比分析 |
4.3 MUSIC算法工程实现 |
4.3.1 协方差矩阵特征值分解的HLS实现 |
4.3.2 MUSIC算法的HLS与System Generator协同实现 |
4.4 本章小结 |
第五章 自适应抗干扰系统实现与测试 |
5.1 自适应抗干扰系统 |
5.1.1 自适应抗干扰系统模型 |
5.1.2 软件无线电硬件平台-USRP |
5.1.3 四通道抗干扰射频模块 |
5.1.4 均匀一维超宽带天线阵列 |
5.2 通信自适应抗干扰系统实现与测试 |
5.2.1 无干扰时通信系统测试 |
5.2.2 有抗干扰通信系统测试 |
5.2.3 自适应抗干扰算法系统测试与分析 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 目前工作的不足以及对未来的展望 |
攻读硕士学位期间发表的论文 |
致谢 |
参考文献 |
(7)大规模矩阵求逆运算电路设计与优化(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 论文研究内容与设计指标 |
1.3.1 研究内容 |
1.3.2 设计指标 |
1.4 论文组织结构 |
第二章 矩阵求逆算法分析及其实现概述 |
2.1 逆矩阵概述 |
2.1.1 逆矩阵定义 |
2.1.2 矩阵求逆方法概述 |
2.2 基于矩阵分解的求逆算法 |
2.2.1 矩阵分解算法概述 |
2.2.2 矩阵分解算法对比 |
2.2.3 下三角矩阵求逆算法 |
2.2.4 矩阵相乘算法 |
2.3 基于Cholesky分解的矩阵求逆电路设计分析 |
2.3.1 矩阵求逆电路设计方案 |
2.3.2 并行计算模型选择 |
2.3.3 矩阵求逆电路设计流程 |
2.4 本章小结 |
第三章 矩阵Cholesky分解电路设计与优化 |
3.1 Cholesky分解算法数据依赖及并行分析 |
3.1.1 Cholesky分解算法数据依赖分析 |
3.1.2 基于线性PE阵列的并行任务设计 |
3.2 矩阵Cholesky分解电路设计 |
3.2.1 Cholesky分解PE单元设计 |
3.2.2 Cholesky分解PE阵列优化 |
3.3 矩阵Cholesky分解电路功能验证 |
3.4 本章小结 |
第四章 下三角矩阵求逆及相乘电路设计与优化 |
4.1 下三角矩阵求逆电路设计与优化 |
4.1.1 下三角矩阵求逆数据依赖分析 |
4.1.2 基于线性PE阵列的并行任务设计 |
4.1.3 下三角矩阵求逆电路设计与优化 |
4.1.4 下三角矩阵求逆电路功能验证 |
4.2 三角矩阵相乘电路设计与优化 |
4.2.1 三角矩阵相乘数据依赖分析 |
4.2.2 基于线性PE阵列的并行任务设计 |
4.2.3 三角矩阵相乘电路设计与优化 |
4.2.4 三角矩阵相乘电路功能验证 |
4.3 矩阵求逆电路整合 |
4.3.1 PE单元及阵列整合 |
4.3.2 PE阵列控制模块 |
4.4 本章小结 |
第五章 矩阵求逆实验结果及分析 |
5.1 验证方案 |
5.2 实验平台及环境 |
5.2.1 FPGA验证平台介绍 |
5.2.2 矩阵求逆系统架构 |
5.2.3 初始数据准备 |
5.2.4 IP核参数设置 |
5.3 功能验证及性能分析 |
5.3.1 系统功能验证 |
5.3.2 系统性能分析 |
5.4 大规模矩阵求逆系统性能解析模型 |
5.4.1 解析模型概述 |
5.4.2 系统性能解析模型构建 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(8)基于FPGA的高光谱目标检测算法实现(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 高光谱目标检测算法的研究现状 |
1.2.2 高光谱目标检测算法实现方法的研究现状 |
1.3 本文的主要工作 |
1.3.1 论文主要内容 |
1.3.2 论文章节安排 |
2 高光谱目标检测算法原理 |
2.1 线性混合模型 |
2.2 正交子空间投影算法 |
2.2.1 正交子空间投影算法原理 |
2.3 递进式正交子空间投影算法 |
2.3.1 递进式正交子空间投影算法的提出目标 |
2.3.2 递进式正交子空间投影算法原理 |
2.4 高光谱图像目标检测算法性能评价 |
2.5 本章小结 |
3 正交子空间投影算法的硬件实现与验证 |
3.1 系统整体设计方案 |
3.2 输入数据的预处理 |
3.3 干扰光谱特征矩阵相乘运算 |
3.3.1 矩阵相乘通用模块 |
3.3.2 干扰光谱特征矩阵相乘模块 |
3.4 矩阵求逆模块 |
3.4.1 矩阵求逆方法的选取 |
3.4.2 改进的Cholesky分解方法 |
3.4.3 矩阵求逆模块的实现 |
3.5 检测算子运算模块 |
3.5.1 正交子空间投影矩阵计算模块 |
3.5.2 算子计算模块 |
3.6 检测量运算模块 |
3.7 OSP算法实现系统的检测结果验证 |
3.7.1 高光谱图像数据介绍 |
3.7.2 矩阵相乘通用模块验证 |
3.7.3 MATLAB软件实现的OSP算法检测结果 |
3.7.4 OSP算法硬件实现系统的检测结果 |
3.8 本章小结 |
4 递进式正交子空间投影算法的硬件实现与验证 |
4.1 总体设计与模块划分 |
4.2 状态机控制模块 |
4.3 地址产生模块 |
4.4 数据存储部分 |
4.5 数据运算部分 |
4.5.1 初值计算模块 |
4.5.2 参数β更新计算模块 |
4.5.3 检测算子更新计算模块 |
4.5.4 投影矩阵更新计算模块 |
4.6 检测量计算模块 |
4.7 ROSP算法实现系统的检测结果验证 |
4.7.1 MATLAB软件实现的ROSP算法检测结果 |
4.7.2 ROSP算法硬件实现系统的检测结果 |
4.8 本章小结 |
5 总结与展望 |
5.1 工作总结 |
5.2 研究展望 |
参考文献 |
致谢 |
作者简历及攻读硕士学位期间的科研成果 |
(9)高适用性大维度矩阵求逆器的算法优化和实现(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和研究意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
1.4 课题来源 |
第二章 矩阵求逆运算 |
2.1 关键算法分析 |
2.2 常见求逆方法 |
2.2.1 伴随矩阵法 |
2.2.2 Gauss-Jordan消去法 |
2.2.3 QR分解求逆矩阵 |
2.2.4 LU分解求逆矩阵 |
2.2.5 四种求逆算法总结 |
2.3 原位替换求逆算法 |
2.3.1 基本算法原理 |
2.3.2 相关算法 |
2.3.3 原位替换算法分析 |
2.4 本章小结 |
第三章 大规模矩阵求逆器的设计方案 |
3.1 改进的原位替换矩阵求逆算法 |
3.1.1 优化的原位替换算法介绍 |
3.1.2 算法优势分析 |
3.2 大维度任意阶矩阵求逆器结构设计及工作流程 |
3.2.1 矩阵求逆器硬件架构 |
3.2.2 矩阵求逆器工作流程 |
3.3 运算结构设计 |
3.3.1 矩阵求逆运算结构选择 |
3.3.2 优化的行修正运算结构设计 |
3.4 存储资源管理及分配 |
3.5 存储地址规则设计方案 |
3.5.1 任意值并行度下的地址规则设计 |
3.5.2 规律变化的并行度地址规则设计 |
3.6 不同运算模式下的运算单元设计 |
3.6.1 约化系数运算单元设计 |
3.6.2 上、下三角逆矩阵运算单元设计 |
3.7 本章小结 |
第四章 大维度矩阵运算器硬件设计实现 |
4.1 大维度矩阵求逆器硬件实现 |
4.1.1 矩阵求逆器系统架构 |
4.1.2 矩阵求逆器地址规则 |
4.1.3 多路并行的运算器互连结构 |
4.2 重构模式下的大维度矩阵分解器设计与实现 |
4.2.1 基于原位替换算法的LU分解算法介绍 |
4.2.2 矩阵分解器硬件实现 |
4.3 本章小结 |
第五章 大维度矩阵求逆器的验证及性能分析 |
5.1 验证方案 |
5.2 MATLAB建模验证 |
5.3 硬件验证 |
5.3.1 运算结果误差 |
5.3.2 硬件资源消耗 |
5.4 性能分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
(10)基于线条追踪的并行化视觉里程计设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外视觉里程计的主要研究成果 |
1.2.1 基于特征点法的视觉里程计 |
1.2.2 基于直接法的视觉里程计 |
1.2.3 基于线特征的视觉里程计 |
1.3 视觉里程计存在的问题 |
1.4 本文主要研究内容与章节安排 |
第2章 视觉里程计基本原理 |
2.1 特征点法 |
2.1.1 特征点匹配 |
2.1.2 初始化 |
2.1.3 RANSAC剔除误匹配 |
2.1.4 PnP求解 |
2.2 LK光流法 |
2.2.1 LK光流法简介 |
2.2.2 LK光流的变形 |
2.3 直接法 |
2.4 李代数的求导 |
2.5 小结 |
第3章 并行化线条追踪 |
3.1 边缘检测 |
3.1.1 Sobel算子 |
3.1.2 SimpleEdge算子 |
3.1.3 Canny算子 |
3.1.4 改进DoG算子 |
3.2 线条提取 |
3.3 线条追踪 |
3.3.1 二维欧氏变换追踪 |
3.3.2 投影变换追踪 |
3.4 基于双目相机与深度相机的改进 |
3.4.1 针对双目相机数据的改进 |
3.4.2 针对深度相机数据的改进 |
3.5 实验效果分析与总结 |
第4章 并行化后端设计 |
4.1 优化后端基本原理 |
4.1.1 Bundle Adjustment基本原理 |
4.1.2 g~2o优化库与图优化理论简介 |
4.2 并行化七步求解法的设计 |
4.2.1 H矩阵的结构特点 |
4.2.2 七步求解法的推导 |
4.3 优化后端整体框架 |
4.3.1 鲁棒性优化后端 |
4.3.2 并行化后端算法整体流程 |
4.3.3 图优化理论的深入探讨 |
4.4 实验设计与总结 |
第5章 基于线条追踪的并行化深度视觉里程计 |
5.1 直接法的讨论 |
5.1.1 采样点数量与分布对直接视觉里程计精度的影响 |
5.1.2 直接法的深入探讨 |
5.2 基于线程池的并行化深度视觉里程计的设计与实现 |
5.2.1 实验平台介绍 |
5.2.2 实验框架设计 |
5.2.3 算法优化策略 |
5.2.4 实验结果分析 |
5.3 实验总结 |
5.3.1 算法的优势 |
5.3.2 算法的不足 |
结论 |
致谢 |
参考文献 |
攻读学位期间取得学术成果 |
四、基于矩阵初等变换的矩阵分解法(论文参考文献)
- [1]基于HLS的复数矩阵QR分解求逆算法的实现与优化[J]. 杨永舟,黄秀琼. 电子技术, 2021(07)
- [2]高速高精度矩阵求逆器的设计与实现[D]. 陈文杰. 合肥工业大学, 2021(02)
- [3]面向几何直观和计算思维的线性代数混合式教学方案[J]. 张大明,李璐,刘华勇,张学勇,王焕宝. 牡丹江师范学院学报(自然科学版), 2020(04)
- [4]高阶浮点矩阵运算IP设计与验证[D]. 秦冀河. 西安电子科技大学, 2020(05)
- [5]高速高精度矩阵运算器的设计与实现[D]. 邱俊豪. 合肥工业大学, 2020
- [6]空域自适应抗干扰算法研究与实现[D]. 江传民. 东南大学, 2020
- [7]大规模矩阵求逆运算电路设计与优化[D]. 陈宗泽. 东南大学, 2019(01)
- [8]基于FPGA的高光谱目标检测算法实现[D]. 唐小芳. 大连海事大学, 2019(06)
- [9]高适用性大维度矩阵求逆器的算法优化和实现[D]. 叶紫燕. 合肥工业大学, 2019(01)
- [10]基于线条追踪的并行化视觉里程计设计与实现[D]. 曹麟. 成都理工大学, 2019(02)