《並行算法設計與性能分析》是依託北京套用物理與計算數學研究所,由劉興平擔任項目負責人的面上項目。
基本介紹
- 中文名:並行算法設計與性能分析
- 項目類別:面上項目
- 項目負責人:劉興平
- 依託單位:北京套用物理與計算數學研究所
- 負責人職稱:60373015
- 批准號:60373015
- 申請代碼:F0204
- 研究期限:2004-01-01 至 2006-12-31
- 支持經費:23(萬元)
《並行算法設計與性能分析》是依託北京套用物理與計算數學研究所,由劉興平擔任項目負責人的面上項目。
《並行算法設計與性能分析》是依託北京套用物理與計算數學研究所,由劉興平擔任項目負責人的面上項目。項目摘要本課題對大規模科學計算中,輻射流體力學數值模擬的並行計算瓶頸之一- - 全局歸約計算進行研究,將網路頻寬和網路延遲引...
(1)並行計算模型 並行算法作為一門學科,首先研究的是並行計算模型。並行計算模型是算法設計者與體系結構研究者之間的一個橋樑,是並行算法設計和分析的基礎。它禁止了並行機之間的差異,從並行機中抽取若干個能反映計算特性的可計算或可測量的參數,並按照模型所定義的計算行為構造成本函式,以此進行算法的複雜度分析...
並行計算模型通常指從並行算法的設計和分析出發,將各種並行計算機(至少某一類並行計算機)的基本特徵抽象出來,形成一個抽象的計算模型。從更廣的意義上說,並行計算模型為並行計算提供了硬體和軟體界面,在該界面的約定下,並行系統硬體設計者和軟體設計者可以開發對並行性的支持機制,從而提高系統的性能。PRAM模型 類型...
並行算法設計中最常用的的方法是PCAM方法,即劃分,通信,組合,映射。首先劃分,就是將一個問題平均劃分成若干份,並讓各個處理器去同時執行;通信階段,就是要分析執行過程中所要交換的數據和任務的協調情況,而組合則是要求將較小的問題組合到一起以提高性能和減少任務開銷,映射則是要將任務分配到每一個處理器...
《可擴展並行算法的設計與分析》是2001年國防工業出版社出版的圖書,作者是李曉梅、莫則堯、胡慶豐、羅曉廣。內容簡介 本書是一本綜合論述可擴展並行算法設計與分析的專著。它系統深入地論述了並行計算機的發展與分類、並行計算模型、並行算法性能度量和可擴展分析、線性代數方程組並行計算、特徵值與特徵向量並行計算、區域...
4.1 數據結構與性能:面向數據的設計 74 4.2 快取未命中的3C:強制、容量與衝突 86 4.3 簡單性能模型:案例研究 90 4.4 高級性能模型 98 4.5 網路訊息 101 4.6 進一步探索 103 4.7 本章小結 104 第5 章 並行算法與模式 105 5.1 並行計算套用的算法分析 105 5.2 性能模型與算法複雜性 106 5.3...
並行運算模型通常是指從並行算法的設計和分析出發,將各種並行運算機(至少某一類並行運算機)的基本特徵抽象出來,形成一個抽象的計算模型。從更廣的意義上說,並行運算模型為並行運算提供了硬體和軟體界面,在該界面的約定下,並行系統硬體設計者和軟體設計者可以開發對並行性的支持機制,從而提高系統的性能。並行算法...
《面向MPSoC的確定性結構化並行程式設計與分析方法研究》是依託北京理工大學,由計衛星擔任項目負責人的青年科學基金項目。項目摘要 為滿足計算密集型套用對高性能計算的需求,多核處理器目前已經在嵌入式和實時系統中得到了廣泛的套用,然而現有基於執行緒模型的並行程式設計方法使並行程式的推理與分析變得非常困難,程式的...
並行算法設計中最常用的的方法是PCAM方法,即劃分,通信,組合,映射。首先劃分,就是將一個問題平均劃分成若干份,並讓各個處理器去同時執行;通信階段,就是要分析執行過程中所要交換的數據和任務的協調情況,而組合則是要求將較小的問題組合到一起以提高性能和減少任務開銷,映射則是要將任務分配到每一個處理器...
High performance computing, 縮寫HPC) 是利用超級計算機實現並行計算的理論、方法、技術以及套用的一門技術科學,圍繞利用不斷發展的並行處理單元以及並行體系架構實現高性能並行計算這一核心問題,該領域研究範圍包括並行計算模型、並行編程模型、並行執行模型、並行自適應框架、並行體系結構、並行網路通信以及並行算法設計等...
1.7.3 並行程式設計的一般步驟 1.7.4 幾點注意事項 §1.8 常見的幾種同步互斥機制 1.8.1 PCF、Fortran中的同步機制 Lock-unlock機制 CriticalSection(臨界段)事件同步 序列同步 1.8.2 CSP中的同步通信機制 1.8.3 Ada中的同步通信機制 §1.9 並行程式設計的性能考慮 1.9.1 數據驅動的並行計算模型 ...
《基於GPU的並行排序算法設計與最佳化》是依託清華大學,由都志輝擔任項目負責人的面上項目。項目摘要 利用GPU來加速科學問題的求解已成為高性能計算的一個重要研究方向,而排序算法是一個非常基礎的算法,設計基於GPU的並行排序算法可以直接支持一大類科學計算套用。基於對GPU內部層次化記憶體模型和流處理單元的抽象與分析,...
8.4 辨別算法中的環112 8.5 提取串列及並行算法的性能參數113 8.6 相關定理114 8.7 串列和並行算法在並行計算機上的性能116 8.8 習題116 第9章 z-變換分析118 9.1 概述118 9.2 z-變換的定義118 9.3 一維有限脈衝回響濾波器算法119 9.4 z-變換的軟體硬體實現119 9.5 設計1: 用霍納法則實現廣播...
《GPU並行算法——N-S方程高性能計算》是2020年科學出版社出版的圖書,作者是白智勇,李志輝。內容簡介 本書共九章,重點通過基礎知識講解、算例剖析和技巧提示,引導讀者熟悉GPU並行算法、CUDA Fortran基礎知識,進而掌握基於CUDA Fortran的GPU高性能計算套用軟體設計方法。其中,第1章介紹相關研究背景;第2~6章介紹基於...
超級計算理論的突破口是並行計算模型。並行計算模型是並行體系結構和並行算法之間的接口界面。在這一界面的約定下,並行系統的設計者可以設計對並行性的支持機構,以提高系統性能;算法設計者可以發展高效率的計算方法以充分利用並行系統的計算能力。通行的將串列算法(程式)人工或自動地改為並行算法(程式)的做法有很大的...
6.2 FFT並行求解過程分析 6.3 並行算法描述 6.4 算法的測試 參考文獻 第7章 卷積的並行算法 7.1 卷積運算概論 7.2 基於SIMD模型的卷積並行算法 7.3 網路並行環境下的卷積並行算法 參考文獻 第8章 數字濾波的並行算法 8.1 基於邏輯環的IIR並行算法設計 8.2 基於LOGP模型的FIR並行算法設計與實現 參考文獻...
《算法設計與分析(第2版)》是由李春葆主編,2018年清華大學出版社出版的高等學校數據結構課程系列教材。該教材適合作為高等院校“算法設計與分析”課程的教材,也可供ACM和各類程式設計競賽者參考。該教材介紹了各種常用的算法設計策略,包括遞歸、分治法、蠻力法、回溯法、分枝限界法、貪心法、動態規劃、機率算法和...
本書是美國Oregon州立大學的MichaelJ.Quinn教授在多年講授“並行程式設計”課程的基礎上編寫而成的,主要介紹用C語言,並結合使用MPI和OpenMP進行並行程式設計,內容包括並行體系結構、並行算法設計、訊息傳遞編程、Eratosthenes篩法、Floyd算法、性能分析、矩陣向量乘法、文檔分類、蒙特卡洛法、矩陣乘法、線性方程組求解、有限...
王曉東,男,福州大學計算機系教授,福建省計算機學會理事長。研究領域是算法設計與算法評價、基於計算機網路和信息安全的大規模問題求解算法與數據結構、信息可視化技術兒何計算、並行和分散式算法設計、計算複雜性理論。主持國家精品課程“算法與數據結構”和“算法設計與分析”的課程建設,獲得2005年福建省教學成果一等獎。
《計算機科學與技術系列教材·算法設計與分析》是一本正文語種為簡體中文的書籍,是一本算法分析的書籍。內容簡介 《計算機科學與技術系列教材?算法設計與分析》作為普通高等學校計算機與信息安全專業本科生的教材,根據國內外計算機技術的最新發展,闡述計算機算法的各種設計策略、算法分析和一些經典及套用問題的算法。全書共...
陳國良教授20多年來系統地開展了並行算法的理論、設計和套用的研究,提出了並行算法研究的一系列新觀點和新方法,形成了“並行算法——並行計算機——並行編程”一體化研究體系。在非數值並行算法和高性能計算及其套用的研究方面做出了系統的創造性成就和重大貢獻。(中國科學技術大學軟體學院評)陳國良院士是中國非數值...
在計算電磁學等諸多領域,隨著實際工程設計面臨的幾何外形和物理特性越來越複雜、以及龐大的計算量帶來的實效性問題,幾何建模和格線生成這兩個前處理部分變得越來越困難,成為制約大規模數值模擬實際套用的主要瓶頸之一。大幅減少前處理時間並實現高精度計算是這些領域具有挑戰性的問題,具有重大的科學意義。 本項目面向...
分析研究表明:目前的能力需求計畫方法不能準確反映生產能力需求;基於數學規劃等方法的能力平衡算法屬於典型的NP問題;ERP等軟體大多採用目前的能力需求計畫方法,缺少能力調整的支持算法。本項目通過研究現有的調度規則和開發新的調度規則,設計具有算術計算複雜性和一定最佳化性能的基於調度規則的調度算法;並直接把該調度算法...
PAML並行算法設計 瓶頸函式確定 所謂瓶頸函式,就是指程式運行過程中比較耗時的函式。如果想最佳化程式、提高程式的性能,應優先處理瓶頸函式。並行算法策略 並行化操作,採用了兩個層次的並行策略:位點間並行 由於每個基因序列中的多個位點間的運算相互獨立,因此將位點劃分給多個處理器核心,使用多執行緒技術 實現同位點計算...