摘要
本申请实施例提供了一种线程束分歧执行的指令处理方法、设备及存储介质,涉及人工智能芯片技术领域,该方法包括:在原始控制流图中产生分支的每个分支起始块设置聚合掩码和分支聚合块的目标地址,聚合掩码指示执行分支起始块的多个线程。在分支聚合块对应的多个分支前驱块分别插入聚合指令,以指示执行每个分支前驱块的线程(即执行分支起始块的多个线程中的部分线程)都到达后,一起按照分支聚合块的目标地址进入到分支聚合块执行,从而保证拓扑序和线程束分歧执行的正确性。其次,由于不需要修改原始控制流图,因此,在编译阶段可针对分支结构正确执行相应的编译优化策略,保证了编译优化(比如依赖消除标记的编译优化)的正确性。