#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 24576x1024:1024x1024_n"bert.inf.tf32.pt.mb64_pvc*96"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 1024x384x64:1024x64x384_n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=abc --dtag=abc 1024x384x384:1024x384x64_n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab --attr-post-ops=gelu_tanh 24576x1024:1024x4096_n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 24576x4096:4096x1024_n"bert.inf.tf32.pt.mb64_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 24576x1024:1024x2_n"bert.inf.tf32.pt.mb64_pvc*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16x2048:2048x1000_n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x1000:1000x2048_n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1000x16:16x2048_n"resnet-50.tr.tf32.pt.mb16_pvc*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 128x2048:2048x1000_n"resnet-50.tr.tf32.pt.mb128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x1000:1000x2048_n"resnet-50.tr.tf32.pt.mb128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1000x128:128x2048_n"resnet-50.tr.tf32.pt.mb128_pvc*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16x2048:2048x1000_n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x1000:1000x2048_n"resnet-50.tr.tf32.pt.mb16_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1000x16:16x2048_n"resnet-50.tr.tf32.pt.mb16_pvc*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1024x3:3x2_n"lqcd.tr.tf32.pt.mb1024_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 1024x2:2x3_n"lqcd.tr.tf32.pt.mb1024_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 1024x3:3x2_n"lqcd.tr.tf32.pt.mb1024_pvc*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 32x200:200x3136_n"3dgan.tr.tf32.tf.mb256*8"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 256x10648:10648x1_n"3dgan.tr.tf32.tf.mb256*8"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 256x1:1x10648_n"3dgan.tr.tf32.tf.mb256*8"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 256x200:200x3136_n"3dgan.tr.tf32.tf.mb256*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 200x256:256x3136_n"3dgan.tr.tf32.tf.mb256*2"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16384x2:2x768_n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16384x768:768x768_n"bert.tr.tf32.tf.mb128_pvc*96"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abcd --wtag=abdc --dtag=abcd 128x12x128x64:128x12x64x128_n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abcd --wtag=abcd --dtag=abcd 128x12x128x128:128x12x128x64_n"bert.tr.tf32.tf.mb128_pvc*48"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16384x768:768x3072_n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 16384x3072:3072x768_n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=tanh 128x768:768x768_n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 128x768:768x2_n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x2:2x768_n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x768:768x768_n"bert.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x768:768x3072_n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x3072:3072x768_n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x768:768x768_n"bert.tr.tf32.tf.mb128_pvc*96"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abcd --wtag=abdc --dtag=abcd 128x12x128x64:128x12x64x128_n"bert.tr.tf32.tf.mb128_pvc*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abdc --wtag=abcd --dtag=abcd 128x12x128x128:128x12x128x64_n"bert.tr.tf32.tf.mb128_pvc*48"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 2x16384:16384x768_n"bert.tr.tf32.tf.mb128_pvc*2"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*1024"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x14:14x200_n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x14:14x200_n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 16384x200:200x1_n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x1:1x200_n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*1528"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 200x128:128x200_n"deepfusion.tr.tf32.tf.m128_pvc*1536"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 14x128:128x200_n"deepfusion.tr.tf32.tf.m128_pvc*508"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*1024"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x14:14x200_n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x14:14x200_n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+logistic:1 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*384"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=sum+tanh 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*128"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 16384x200:200x1_n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 16384x1:1x200_n"deepfusion.tr.tf32.tf.m128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x200:200x200_n"deepfusion.tr.tf32.tf.m128_pvc*1528"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 200x128:128x200_n"deepfusion.tr.tf32.tf.m128_pvc*1536"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 14x128:128x200_n"deepfusion.tr.tf32.tf.m128_pvc*508"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x512x3:4x3x15000_n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x128x3:4x3x512_n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x512x3:4x3x128_n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 4x15000x3:4x3x512_n"pointnet-atlas.tr.tf32.pt.mb4*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x512x3:2x3x15000_n"pointnet-atlas.tr.tf32.pt.mb4*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x128x3:2x3x512_n"pointnet-atlas.tr.tf32.pt.mb4*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x512x3:2x3x128_n"pointnet-atlas.tr.tf32.pt.mb4*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 2x15000x3:2x3x512_n"pointnet-atlas.tr.tf32.pt.mb4*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x1024:1024x512_n"pointnet.tr.tf32.pt.mb16*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x512:512x256_n"pointnet.tr.tf32.pt.mb16*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x256:256x49_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 16x7x7:16x7x15000_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x256:256x4096_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=abc --wtag=acb --dtag=abc 16x64x64:16x64x15000_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ba --dtag=ab 16x256:256x4_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=acb --wtag=acb --dtag=abc 16x64x64:16x64x15000_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=acb --wtag=abc --dtag=abc 16x64x15000:16x15000x64_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x4096:4096x256_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 4096x16:16x256_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x256:256x512_n"pointnet.tr.tf32.pt.mb16*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 256x16:16x512_n"pointnet.tr.tf32.pt.mb16*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x512:512x1024_n"pointnet.tr.tf32.pt.mb16*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 512x16:16x1024_n"pointnet.tr.tf32.pt.mb16*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=acb --wtag=abc --dtag=abc 16x7x15000:16x15000x7_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 16x49:49x256_n"pointnet.tr.tf32.pt.mb16*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 49x16:16x256_n"pointnet.tr.tf32.pt.mb16*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x5270:5270x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x1000:1000x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*16"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x942:942x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 128x2000:2000x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab 128x1000:1000x1_n"uno_convergence.tr.tf32.tf.mb128_pvc*2"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x1:1x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x1000:1000x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*8"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 128x1000:1000x2000_n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 942x128:128x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 5270x128:128x1000_n"uno_convergence.tr.tf32.tf.mb128_pvc*1"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x32_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x16_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 11456x16:16x1_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 16x11456:11456x1_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x1:1x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x96_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x96_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x51_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x51_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x54_n"dcrnn.tr.tf32.tf.mb64*11"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x54_n"dcrnn.tr.tf32.tf.mb64*11"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x16_n"dcrnn.tr.tf32.tf.mb64*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x32_n"dcrnn.tr.tf32.tf.mb64*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x54:54x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x54:54x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x96:96x32_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x96:96x16_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x51:51x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x51:51x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 179x16:16x1_n"dcrnn.tr.tf32.tf.mb64*12"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x54:54x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x32_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x96:96x16_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 11456x51:51x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 11456x16:16x1_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x1:1x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 16x11456:11456x1_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x96_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x96_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x51_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x51_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x16:16x54_n"dcrnn.tr.tf32.tf.mb64*11"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 11456x32:32x54_n"dcrnn.tr.tf32.tf.mb64*11"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x16_n"dcrnn.tr.tf32.tf.mb64*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 54x11456:11456x32_n"dcrnn.tr.tf32.tf.mb64*1"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x54:54x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x54:54x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x96:96x32_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x96:96x16_n"dcrnn.tr.tf32.tf.mb64*24"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=logistic:1 179x51:51x32_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 179x51:51x16_n"dcrnn.tr.tf32.tf.mb64*12"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ab --dtag=ab 179x16:16x1_n"dcrnn.tr.tf32.tf.mb64*12"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 32x1856:1856x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 32x128:128x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=tanh 32x128:128x1_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x1_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x1:1x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 1856x32:32x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x1856_n"mma.tr.tf32.tf.mb32*3"
#
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=relu 32x1856:1856x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=2 --stag=ab --wtag=ab --dtag=ab 32x128:128x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --bia_dt=f32 --bia_mask=0 --stag=ab --wtag=ab --dtag=ab --attr-post-ops=tanh 32x128:128x1_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x1_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x1:1x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 128x32:32x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ba --wtag=ab --dtag=ab 1856x32:32x128_n"mma.tr.tf32.tf.mb32*3"
--reset --check-ref-impl=true --allow-enum-tags-only=0 --dt=f32 --attr-fpmath=tf32 --stag=ab --wtag=ba --dtag=ab 32x128:128x1856_n"mma.tr.tf32.tf.mb32*3"
