当前位置: 首页 > news >正文

网站注册公司外国高端网站设计

网站注册公司,外国高端网站设计,免费网站开发公司,石家庄经济Floorplanning with Graph Attention DAC ’22 目录 Floorplanning with Graph Attention摘要1.简介2.相关工作3.问题公式化4. FLORA的方法4.1 解决方案概述4.2 C-谱聚类算法 4.3 基于GAT的模型4.4 合成训练数据集生成 摘要 布图规划一直是一个关键的物理设计任务#xff0…Floorplanning with Graph Attention DAC ’22 目录 Floorplanning with Graph Attention摘要1.简介2.相关工作3.问题公式化4. FLORA的方法4.1 解决方案概述4.2 C-谱聚类算法 4.3 基于GAT的模型4.4 合成训练数据集生成 摘要 布图规划一直是一个关键的物理设计任务具有很高的计算复杂度。它的主要目标是确定初始位置的宏和标准单元与优化的线长为给定的面积约束。本文介绍了Flora一个基于图形注意力的布图规划器学习电路连接性和物理线长之间的优化映射并使用高效的模型推理产生芯片布图规划。植物群已与两个最先进的混合放置工具整合。使用学术基准和工业设计的实验研究表明与最先进的混合尺寸放置器相比Flora将放置运行时间提高了18%平均线长减少了2%。 1.简介 在超大规模集成电路芯片的物理实现中芯片布图规划一直是一项关键且具有挑战性的任务。它影响到关键的下游优化目标其中布局线长是最重要的一个。与仅放置宏的传统布图规划不同现代版本输入混合宏块和标准单元的网表并放置它们以便针对给定区域约束优化物理线长这与时序和可布线性密切相关[10]。即使在经典公式[14]中也被证明是NP难的芯片布图规划难以使用算法方法有效地解决。缺乏有效的自动化工具大多数专家设计师他们采取手动方式完成这项工作通常需要数月的紧张工作[13]。为了提高生产力Google开发了一种基于深度强化学习的平面规划器[13]。采用成功的AlphaGo系统中使用的方法它将布局规划视为一系列移动每个移动都在芯片上放置一个宏。当所有的宏被放置时下游的物理实现阶段使用商业工具进行并且计算最终的奖励。与AlphaGo类似这个最终奖励被反向传播到序列中的每个情况和动作并基于这些奖励训练评估网络和策略网络。在TPU设计上它报告了比人类专家更好的结果由系统在6小时内生成。 我们的工作受到了Google工作的极大启发我们同意深度学习是解决芯片布局问题的一种有前途的方法。另一方面我们在芯片布局规划上使用强化学习是相当保守的因为将任务分解为一系列移动每个移动只放置一个块使工作复杂化。与围棋游戏完全不同的是在围棋游戏中玩家只能在对方未知的下一步棋之前走一步棋芯片设计师预先拥有电路网表的完整连接信息并且很少需要在顺序过程中一次一个块地进行布图规划。在现实中考虑到电路的整体视图专家设计师通常将电路划分为越来越精细的子电路并且每次同时将一个级别的所有子电路放置在芯片上优化它们之间的数据流。本质上它是一次建立粗略的布图规划的过程其中从子电路连接到物理位置的映射是优化的。 在这项工作中我们追求一个图形注意力网络GAT为基础的方法芯片布局。根据“在人类直觉发挥作用的地方神经网络可能获胜”的一般经验法则我们方法的主要思想是利用GAT [16]来获得对子电路连接性的整体理解并学习子电路连接性和物理线长之间的优化映射然后通过有效的模型推理解码电路块的物理位置。所得到的布局然后用于驱动下游的混合大小的布局任务。本文旨在回答以下研究问题。 (1)如何在电路连接性和物理线长之间建立优化的映射我们建议使用基于GAT的方法。所提出的模型包括共享的基于GAT的编码器随后是两个任务特定的自动编码器以学习电路连接性和物理线长之间的优化映射并生成宏和标准单元的物理位置即芯片布局然后驱动下游布局任务。 (2)如何在不需要大的真实世界数据集的情况下训练基于GAT的布图规划器现实世界的最佳布图规划是具有挑战性的。**我们提出了一种方法来生成一个合成的训练数据集来训练GAT模型。**在数据集中电路连通性和物理线长之间的映射被保证是最优的。此外它还提供了广泛的统计连接分布以确保经过训练的模型在现实世界的设计中得到很好的推广。 拟议的平面规划器称为Flora已与两个最先进的混合大小的放置工具结合47]这将是公开发布的合成数据集沿着。使用ISPD 2005基准测试和实际行业设计的实验研究表明与最先进的混合尺寸放置器相比植物群始终将放置运行时间提高了18%平均线长减少了2%。使用学术基准和工业设计也验证了所提出的基于GAT的方法的泛化能力。本文的其余部分组织如下。第2节总结了相关工作。第3节描述了问题公式化。第4节介绍了拟议的方法。第5节展示了实验结果。我们在第6节中结束本文。 2.相关工作 布局规划是NP难问题其确定大型物理模块例如嵌入式存储器、知识产权IP核、标准单元簇并且能够早期估计互连线长[1]。研究人员提出了各种表示方案[14]和优化算法[9]。布图规划的早期工作集中在宏包装上并将放置标准单元的任务留给下游放置器这可能限制物理设计的优化空间[8]。最近的工作解决了宏和标准单元格的放置问题同时作为一个混合大小的放置任务[12]。 最先进的混合尺寸放置器包括ePlace [11]RePlAce [4]和DREAMPlace [7]其将混合尺寸放置问题表述为约束非线性优化问题。目标函数由凸线长函数和加权非凸密度函数组成。芯片布局是一个由无线感应力和密度感应力共同驱动的迭代优化过程。研究表明这些方法产生高质量的解决方案但需要很长的迭代时间。 最近谷歌开发了一种基于深度强化学习的平面规划器[13]。它按顺序放置宏并迭代计算奖励然后反向传播以训练策略网络。它报告了比人类专家更好和更快的TPU设计结果。然而有了完整的电路预先提供网表信息基于强化学习的顺序优化过程可能不必要地使工作复杂化。受电路专家如何创建和优化芯片布局的启发我们采用基于GAT的方法来学习从电路连接到具有优化线长的块物理位置的映射。 3.问题公式化 平面布置图实例可以被建模为具有对象集合的超图 G ( C E ) G(CE) G(CE)即宏和聚集的标准单元由超边连接。芯片布图规划的主要目标可以用公式表示为最小化总线长 W c Wc Wc同时遵守密度约束 p ( c ) p(c) p(c)。 布图规划的总线长可以被估计为所有连接的对象之间的线长的总和其在等式2中定义。 其中 e i j e_{ij} eij​和 d i j d_{ij} dij​分别表示对象 i i i和 j j j之间的连接数和距离 A i j A_{ij} Aij​是邻接矩阵如果对象 i i i和 j j j连接则 A i j 1 A_{ij} 1 Aij​1否则为0。对于给定的电路网表 e e e和 a a a是已知的。根据等式2布图规划的目标是计算连接对象之间的最佳距离 d d d。因此布图规划的本质是构建互连和物理距离之间的优化映射然后引导下游任务优化并产生最终的芯片布局。 4. FLORA的方法 即所提出的基于GAT的布图规划器。它首先描述了整体算法流程然后介绍了植物群的关键组件包括聚类基于GAT的模型和合成训练数据集生成。 4.1 解决方案概述 图1描述了FLORA的整体算法流程。给定一个电路网表表示为一个加权的无向超图植物群分区的网表成子电路簇使用建议的C-谱聚类算法。划分的子电路超图包括宏和标准单元的集群被送入基于GAT的模型以生成芯片布局然后送入下游的放置器以产生最终的芯片布局。GAT模型使用合成数据集进行训练而不需要真实世界的芯片设计。该数据集涵盖了广泛的电路连接性分布以确保所提出的基于GAT的布图规划器的泛化。 4.2 C-谱聚类算法 本节描述所提出的c-谱聚类算法。先前的工作表明谱聚类可以有效地最小化簇间加权连接但运行时间较长。大规模的图形[15]。提出的c-谱聚类算法的目的是利用谱聚类的好处但避免其高计算成本通过自底向上的超边缘粗化。 所提出的c-谱聚类算法在Alg.1.第1-2行描述了自底向上的超边缘粗化过程。由于具有高连通性权重的对象需要紧密地放置在芯片上粗化过程基于超边缘权重执行自底向上聚类从而减小图的规模并减轻谱聚类的计算成本。具体地给定在无向超图中描述的电路网表超边粗化过程首先基于边权重以非递增顺序对超边进行排序。按照排序顺序由同一超边连接的对象将合并到一个簇中。该过程继续直到达到集群总数方面的预定义界限。 粗化过程的输出即一个规模小得多的超图然后被送入谱聚类第3-4行。我们采用基于谱的聚类方法[15]。我们首先计算图的拉普拉斯矩阵并计算对应于的第二小特征值的特征向量。然后我们对特征向量进行排序并通过查找排序后的特征向量的最大 k − 1 k− 1 k−1间隙将对象划分为簇。我们还应用Lanczos算法[5]来提高特征值和特征向量的计算效率。最后我们提取宏作为单个集群以平衡每个集群内的细胞的总面积。 4.3 基于GAT的模型 本节介绍了所提出的用于布图规划生成的基于GAT的模型该模型具有电路连接性和物理线长之间的优化映射。架构如图1所示该模型包含三个关键组件包括一个共享编码器和两个特定于任务的自动编码器分别称为Dtask-model和Ltask-model。共享编码器对电路网表信息进行编码。用GAT [16]嵌入。Dtask模型旨在学习嵌入以建立电路连接性和布局图中连接对象之间的物理线长之间的优化映射。Dtask-model的嵌入与Ltask-model的嵌入级联然后馈送到Ltask-model解码器以生成对象物理位置或芯片布局。 共享GAT编码器。到共享GAT编码器的输入是由c谱聚类生成的聚类级网表参见图1。第4.2节表示为由对象集合 V V V和邻接矩阵 A A A定义的图 G ( V , A ) G(V,A) G(V,A)。每个对象具有表示连接性分布的 N N N维特征向量。设 F ∈ R N ∗ N F∈R^{N*N} F∈RN∗N是包含所有对象的特征向量作为行的特征矩阵。邻接矩阵 A A A中的元素表示是否有链接有为1没有为0。 共享的基于GAT的编码器通过聚合来自其本地邻居的消息来学习每个对象的新表示称为第一级对象嵌入 e f ∈ R N ∗ M e^f∈R^{N*M} ef∈RN∗M其中M是每个对象中新特征的维度。然后将 e f e^f ef传递给Dtask-model和Ltask-model以完成以下具体任务。 Dtask-model. 它的目的是学习集群网表连接和物理线长之间的优化映射。该模型由一个GAT层和一个多层感知器MLP[6]组成GAT层用于计算维距离嵌入 e d ∈ R N ∗ M e^d ∈ R^{N*M} ed∈RN∗MMLP将解码为连接对象 e d e^d ed的距离 D ∈ R N ∗ N D ∈ R^{N*N} D∈RN∗N。由于GAT可以为邻居分配不同的注意力因此它能够学习对象之间的相关性并将具有更多相关性的邻居编码为更接近新特征空间中的对象从而使模型能够学习所有连接对象的互连和距离之间的映射。 设 Z d ∈ R N ∗ N Z^d ∈ R^{N*N} Zd∈RN∗N是包含距离信息的D任务模型的输出矩阵我们定义了模型计算 Z d Z^d Zd如下 其中 t ζ d : R M → R H t_{\zeta_{d}}:\mathbb{R}^{M}\rightarrow\mathbb{R}^{H} tζd​​:RM→RH是一个GAT层具有可学习的参数以计算距离嵌入 e d e^d ed。同时 A f θ d : R H → R N Af_{\theta_{d}}:\mathbb{R}^{H}\rightarrow\mathbb{R}^{N} Afθd​​:RH→RN是具有可学习的参数乘以邻接矩阵 A A A解码来得到连接对象之间距离的MLP。该模型通过最小化地面真实值和预测值之间的均方损失MSELoss进行训练如下所示 Ltask-model. 其旨在生成芯片布图规划即宏和标准单元簇的位置。Ltask-model的架构类似于Dtask-model的架构GAT层后面跟着MLP定义如下 其中 Z l Z^l Zl表示由Ltask模型预测的对象位置 t ζ l : R M → R T t_{\zeta_{l}}:\mathbb{R}^{M}\rightarrow\mathbb{R}^{T} tζl​​:RM→RT是具有可学习参数 ζ l \zeta_{l} ζl​的GAT层用于计算位置嵌入 e l e^l el ⊕ \oplus ⊕表示级联运算符并且 f θ l : R T H → R 2 f_{\theta_{l}}:\mathbb{R}^{TH}\rightarrow\mathbb{R}^{2} fθl​​:RTH→R2是具有可学习参数 θ \theta θ的MLP用于解码对象位置。特别是为了建立对象的相对距离和绝对坐标之间的映射我们将位置嵌入 e d e^d ed和距离嵌入 e c e^c ec作为位置嵌入并将其馈送到下面的MLP层以生成对象分布。 该模型使用地面真实值和预测值 Z l Z^l Zl之间的MSELoss进行训练如下所示: 通过组合来自Dtask模型和Ltask模型的损失函数基于GAT的模型的最终损失函数定义如下 4.4 合成训练数据集生成 现实世界的最佳平面布置很难获得。即使假设它们的最佳布局是已知的有限数量的公共基准也远远不足以支持深度模型的训练。我们提出了一种方法来创建一个合成训练数据集来解决这个问题[3]。 合成训练数据集的创建需要保证每个创建的网表-布图规划对应包含电路连接性和物理线长之间的最佳映射。如第3节中所述布图规划器的主要优化目标是最小化总线长其可以被计算为等式2。我们可以从给定的集群网表中提取的关键特征是和它们可以转换为连通性的统计分布更具体地说两个邻居之间的连接数分布和每个对象的邻居数分布。为了构建训练数据集我们首先创建一个空的芯片区域并将所有对象放置在该区域上。然后我们计算了和在各种簇电路中的概率分布可以分别表示为 P ( e ) P(e) P(e)和 P ( b ) P(b) P(b)。接下来我们生成邻居的数量 B ( b 1 . b i , . . b n ) P ( b ) B(b_1.b_i,..b_n)~P(b) B(b1​.bi​,..bn​) P(b)并且连接数 E ( e 1 , … , e i , … , e n ) , ∀ e i ∼ P ( e ) E(e_{1},\ldots,e_{i},\ldots,e_{n}),\forall e_{i}\sim P(e) E(e1​,…,ei​,…,en​),∀ei​∼P(e)其中 b i b_i bi​表示对象的邻居数量表示对象 i i i与其邻居 e i e_i ei​之间的连接分布。我们将 e i ∈ E e_i∈E ei​∈E按降序排序并将更多的连接分配给距离更近的邻居。对象之间的连接的最终数量被设置为对象对的平均连接。然后每个对象的坐标 O ( x , y ) O(x,y) O(x,y)可以被视为位置标签每个连接的对象对之间的物理距离是距离标签。数据集的构造在Alg.2中描述。 因此我们可以获得具有最佳布图规划解决方案的合成训练数据集参见图1证明同时确保统计连接分布的广泛覆盖从而使训练模型在各种基准上得到很好的推广。定理4.1.在Alg.2是最佳的。 此外合成数据集应在电路连接性方面提供广泛的覆盖范围以确保训练模型的泛化。如图2所示两个关键特征和的分布在不同的基准测试中用不同的颜色表示有很大的不同。在这项工作中合成数据集的连通性统计数据充分覆盖了学术基准例如ISPD2005和实际行业设计可以进一步扩展以适应具有不同连接统计数据的新设计。
http://icebutterfly214.com/news/21212/

相关文章:

  • 2025 年 11 月冷库板/聚氨酯冷库板/机制板, 冷库门, 冷库工程/冷库集成厂家推荐排行榜:专业制造与高效保温系统解决方案
  • 价值权衡的完整计算模型:价值体系与规则体系的辩证统一
  • 2025年11月黄黑皮美白产品对比榜:从成分到肤感十款实测排名
  • 2025年11月学生平板品牌推荐:护眼大屏榜对比学习场景差异
  • 2025年11月适合小学生的学习机推荐榜:五强参数与体验全解析
  • 每日反思(2025_11_05)
  • CRT弹窗接收用户文本输入
  • 题解:AT_abc225_h [ABC225H] Social Distance 2
  • 表相关操作
  • 102302149赖翊煊数据采集第二次作业
  • 引领未来,智启新程:Compete MIS平台——低代码时代的全能信息化管理解决方案
  • CF2085D Serval and Kaitenzushi Buffet
  • 11月6日
  • Spring ApplicationEventPublisher 事件发布
  • 选择 Tita 新绩效一体化的 5 大理由
  • 团队第一次作业
  • 备考笔记8
  • 数字识别模型
  • 搜维尔科技:Xsens动作捕捉系统实时捕捉人体运动数据,为人形机器人提供拟人化动作训练和实时控制支持
  • java word转 pdf
  • 运维审计/堡垒机选型 2025:从 SSH 直连|堡垒机绕行的可见性到“命令+返回文本”的内容级证据
  • java第三天
  • [题解]P10277 [USACO24OPEN] Bessies Interview S
  • 第一次团队项目作业
  • attention论文及Transformer工作原理概述
  • P10277 [USACO24OPEN] Bessies Interview S 题解
  • vue 3.x 前端导出功能
  • 不越狱给iOS App装Tweak/插件:LiveContainer环境介绍与Tweak编写
  • Bigtop 从零开始搭建大数据集群
  • 2025济南艺考文化课培训推荐榜:艺考文化课培训,艺考文化课培训机构适配不同艺考生需求