test/CodeGen/R600/alu-split.ll


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850

;RUN: llc < %s -march=r600 -mcpu=redwood | FileCheck %s

;CHECK: ALU
;CHECK: ALU
;CHECK: ALU
;CHECK-NOT: ALU

define void @main() #0 {
main_body:
  %0 = call float @llvm.R600.load.input(i32 4)
  %1 = call float @llvm.R600.load.input(i32 5)
  %2 = call float @llvm.R600.load.input(i32 6)
  %3 = call float @llvm.R600.load.input(i32 7)
  %4 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 16)
  %5 = extractelement <4 x float> %4, i32 0
  %6 = fcmp une float 0x4016F2B020000000, %5
  %7 = select i1 %6, float 1.000000e+00, float 0.000000e+00
  %8 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 16)
  %9 = extractelement <4 x float> %8, i32 1
  %10 = fcmp une float 0x401FDCC640000000, %9
  %11 = select i1 %10, float 1.000000e+00, float 0.000000e+00
  %12 = fsub float -0.000000e+00, %7
  %13 = fptosi float %12 to i32
  %14 = fsub float -0.000000e+00, %11
  %15 = fptosi float %14 to i32
  %16 = bitcast i32 %13 to float
  %17 = bitcast i32 %15 to float
  %18 = bitcast float %16 to i32
  %19 = bitcast float %17 to i32
  %20 = or i32 %18, %19
  %21 = bitcast i32 %20 to float
  %22 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 17)
  %23 = extractelement <4 x float> %22, i32 0
  %24 = fcmp une float 0xC00574BC60000000, %23
  %25 = select i1 %24, float 1.000000e+00, float 0.000000e+00
  %26 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 17)
  %27 = extractelement <4 x float> %26, i32 1
  %28 = fcmp une float 0x40210068E0000000, %27
  %29 = select i1 %28, float 1.000000e+00, float 0.000000e+00
  %30 = fsub float -0.000000e+00, %25
  %31 = fptosi float %30 to i32
  %32 = fsub float -0.000000e+00, %29
  %33 = fptosi float %32 to i32
  %34 = bitcast i32 %31 to float
  %35 = bitcast i32 %33 to float
  %36 = bitcast float %34 to i32
  %37 = bitcast float %35 to i32
  %38 = or i32 %36, %37
  %39 = bitcast i32 %38 to float
  %40 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 18)
  %41 = extractelement <4 x float> %40, i32 0
  %42 = fcmp une float 0xBFC9A6B500000000, %41
  %43 = select i1 %42, float 1.000000e+00, float 0.000000e+00
  %44 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 18)
  %45 = extractelement <4 x float> %44, i32 1
  %46 = fcmp une float 0xC0119BDA60000000, %45
  %47 = select i1 %46, float 1.000000e+00, float 0.000000e+00
  %48 = fsub float -0.000000e+00, %43
  %49 = fptosi float %48 to i32
  %50 = fsub float -0.000000e+00, %47
  %51 = fptosi float %50 to i32
  %52 = bitcast i32 %49 to float
  %53 = bitcast i32 %51 to float
  %54 = bitcast float %52 to i32
  %55 = bitcast float %53 to i32
  %56 = or i32 %54, %55
  %57 = bitcast i32 %56 to float
  %58 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 19)
  %59 = extractelement <4 x float> %58, i32 0
  %60 = fcmp une float 0xC02085D640000000, %59
  %61 = select i1 %60, float 1.000000e+00, float 0.000000e+00
  %62 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 19)
  %63 = extractelement <4 x float> %62, i32 1
  %64 = fcmp une float 0xBFD7C1BDA0000000, %63
  %65 = select i1 %64, float 1.000000e+00, float 0.000000e+00
  %66 = fsub float -0.000000e+00, %61
  %67 = fptosi float %66 to i32
  %68 = fsub float -0.000000e+00, %65
  %69 = fptosi float %68 to i32
  %70 = bitcast i32 %67 to float
  %71 = bitcast i32 %69 to float
  %72 = bitcast float %70 to i32
  %73 = bitcast float %71 to i32
  %74 = or i32 %72, %73
  %75 = bitcast i32 %74 to float
  %76 = insertelement <4 x float> undef, float %21, i32 0
  %77 = insertelement <4 x float> %76, float %39, i32 1
  %78 = insertelement <4 x float> %77, float %57, i32 2
  %79 = insertelement <4 x float> %78, float %75, i32 3
  %80 = insertelement <4 x float> undef, float %21, i32 0
  %81 = insertelement <4 x float> %80, float %39, i32 1
  %82 = insertelement <4 x float> %81, float %57, i32 2
  %83 = insertelement <4 x float> %82, float %75, i32 3
  %84 = call float @llvm.AMDGPU.dp4(<4 x float> %79, <4 x float> %83)
  %85 = bitcast float %84 to i32
  %86 = icmp ne i32 %85, 0
  %87 = sext i1 %86 to i32
  %88 = bitcast i32 %87 to float
  %89 = bitcast float %88 to i32
  %90 = xor i32 %89, -1
  %91 = bitcast i32 %90 to float
  %92 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 20)
  %93 = extractelement <4 x float> %92, i32 0
  %94 = fcmp une float 0x401FDCC640000000, %93
  %95 = select i1 %94, float 1.000000e+00, float 0.000000e+00
  %96 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 20)
  %97 = extractelement <4 x float> %96, i32 1
  %98 = fcmp une float 0xC00574BC60000000, %97
  %99 = select i1 %98, float 1.000000e+00, float 0.000000e+00
  %100 = fsub float -0.000000e+00, %95
  %101 = fptosi float %100 to i32
  %102 = fsub float -0.000000e+00, %99
  %103 = fptosi float %102 to i32
  %104 = bitcast i32 %101 to float
  %105 = bitcast i32 %103 to float
  %106 = bitcast float %104 to i32
  %107 = bitcast float %105 to i32
  %108 = or i32 %106, %107
  %109 = bitcast i32 %108 to float
  %110 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 21)
  %111 = extractelement <4 x float> %110, i32 0
  %112 = fcmp une float 0x40210068E0000000, %111
  %113 = select i1 %112, float 1.000000e+00, float 0.000000e+00
  %114 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 21)
  %115 = extractelement <4 x float> %114, i32 1
  %116 = fcmp une float 0xBFC9A6B500000000, %115
  %117 = select i1 %116, float 1.000000e+00, float 0.000000e+00
  %118 = fsub float -0.000000e+00, %113
  %119 = fptosi float %118 to i32
  %120 = fsub float -0.000000e+00, %117
  %121 = fptosi float %120 to i32
  %122 = bitcast i32 %119 to float
  %123 = bitcast i32 %121 to float
  %124 = bitcast float %122 to i32
  %125 = bitcast float %123 to i32
  %126 = or i32 %124, %125
  %127 = bitcast i32 %126 to float
  %128 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 22)
  %129 = extractelement <4 x float> %128, i32 0
  %130 = fcmp une float 0xC0119BDA60000000, %129
  %131 = select i1 %130, float 1.000000e+00, float 0.000000e+00
  %132 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 22)
  %133 = extractelement <4 x float> %132, i32 1
  %134 = fcmp une float 0xC02085D640000000, %133
  %135 = select i1 %134, float 1.000000e+00, float 0.000000e+00
  %136 = fsub float -0.000000e+00, %131
  %137 = fptosi float %136 to i32
  %138 = fsub float -0.000000e+00, %135
  %139 = fptosi float %138 to i32
  %140 = bitcast i32 %137 to float
  %141 = bitcast i32 %139 to float
  %142 = bitcast float %140 to i32
  %143 = bitcast float %141 to i32
  %144 = or i32 %142, %143
  %145 = bitcast i32 %144 to float
  %146 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 23)
  %147 = extractelement <4 x float> %146, i32 0
  %148 = fcmp une float 0xBFD7C1BDA0000000, %147
  %149 = select i1 %148, float 1.000000e+00, float 0.000000e+00
  %150 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 23)
  %151 = extractelement <4 x float> %150, i32 1
  %152 = fcmp une float 0x401E1D7DC0000000, %151
  %153 = select i1 %152, float 1.000000e+00, float 0.000000e+00
  %154 = fsub float -0.000000e+00, %149
  %155 = fptosi float %154 to i32
  %156 = fsub float -0.000000e+00, %153
  %157 = fptosi float %156 to i32
  %158 = bitcast i32 %155 to float
  %159 = bitcast i32 %157 to float
  %160 = bitcast float %158 to i32
  %161 = bitcast float %159 to i32
  %162 = or i32 %160, %161
  %163 = bitcast i32 %162 to float
  %164 = insertelement <4 x float> undef, float %109, i32 0
  %165 = insertelement <4 x float> %164, float %127, i32 1
  %166 = insertelement <4 x float> %165, float %145, i32 2
  %167 = insertelement <4 x float> %166, float %163, i32 3
  %168 = insertelement <4 x float> undef, float %109, i32 0
  %169 = insertelement <4 x float> %168, float %127, i32 1
  %170 = insertelement <4 x float> %169, float %145, i32 2
  %171 = insertelement <4 x float> %170, float %163, i32 3
  %172 = call float @llvm.AMDGPU.dp4(<4 x float> %167, <4 x float> %171)
  %173 = bitcast float %172 to i32
  %174 = icmp ne i32 %173, 0
  %175 = sext i1 %174 to i32
  %176 = bitcast i32 %175 to float
  %177 = bitcast float %176 to i32
  %178 = xor i32 %177, -1
  %179 = bitcast i32 %178 to float
  %180 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 8)
  %181 = extractelement <4 x float> %180, i32 0
  %182 = fcmp une float 0x401FDCC640000000, %181
  %183 = select i1 %182, float 1.000000e+00, float 0.000000e+00
  %184 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 8)
  %185 = extractelement <4 x float> %184, i32 1
  %186 = fcmp une float 0xC00574BC60000000, %185
  %187 = select i1 %186, float 1.000000e+00, float 0.000000e+00
  %188 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 8)
  %189 = extractelement <4 x float> %188, i32 2
  %190 = fcmp une float 0x40210068E0000000, %189
  %191 = select i1 %190, float 1.000000e+00, float 0.000000e+00
  %192 = fsub float -0.000000e+00, %183
  %193 = fptosi float %192 to i32
  %194 = fsub float -0.000000e+00, %187
  %195 = fptosi float %194 to i32
  %196 = fsub float -0.000000e+00, %191
  %197 = fptosi float %196 to i32
  %198 = bitcast i32 %193 to float
  %199 = bitcast i32 %195 to float
  %200 = bitcast i32 %197 to float
  %201 = bitcast float %199 to i32
  %202 = bitcast float %200 to i32
  %203 = or i32 %201, %202
  %204 = bitcast i32 %203 to float
  %205 = bitcast float %198 to i32
  %206 = bitcast float %204 to i32
  %207 = or i32 %205, %206
  %208 = bitcast i32 %207 to float
  %209 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 9)
  %210 = extractelement <4 x float> %209, i32 0
  %211 = fcmp une float 0xBFC9A6B500000000, %210
  %212 = select i1 %211, float 1.000000e+00, float 0.000000e+00
  %213 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 9)
  %214 = extractelement <4 x float> %213, i32 1
  %215 = fcmp une float 0xC0119BDA60000000, %214
  %216 = select i1 %215, float 1.000000e+00, float 0.000000e+00
  %217 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 9)
  %218 = extractelement <4 x float> %217, i32 2
  %219 = fcmp une float 0xC02085D640000000, %218
  %220 = select i1 %219, float 1.000000e+00, float 0.000000e+00
  %221 = fsub float -0.000000e+00, %212
  %222 = fptosi float %221 to i32
  %223 = fsub float -0.000000e+00, %216
  %224 = fptosi float %223 to i32
  %225 = fsub float -0.000000e+00, %220
  %226 = fptosi float %225 to i32
  %227 = bitcast i32 %222 to float
  %228 = bitcast i32 %224 to float
  %229 = bitcast i32 %226 to float
  %230 = bitcast float %228 to i32
  %231 = bitcast float %229 to i32
  %232 = or i32 %230, %231
  %233 = bitcast i32 %232 to float
  %234 = bitcast float %227 to i32
  %235 = bitcast float %233 to i32
  %236 = or i32 %234, %235
  %237 = bitcast i32 %236 to float
  %238 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 10)
  %239 = extractelement <4 x float> %238, i32 0
  %240 = fcmp une float 0xBFD7C1BDA0000000, %239
  %241 = select i1 %240, float 1.000000e+00, float 0.000000e+00
  %242 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 10)
  %243 = extractelement <4 x float> %242, i32 1
  %244 = fcmp une float 0x401E1D7DC0000000, %243
  %245 = select i1 %244, float 1.000000e+00, float 0.000000e+00
  %246 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 10)
  %247 = extractelement <4 x float> %246, i32 2
  %248 = fcmp une float 0xC019893740000000, %247
  %249 = select i1 %248, float 1.000000e+00, float 0.000000e+00
  %250 = fsub float -0.000000e+00, %241
  %251 = fptosi float %250 to i32
  %252 = fsub float -0.000000e+00, %245
  %253 = fptosi float %252 to i32
  %254 = fsub float -0.000000e+00, %249
  %255 = fptosi float %254 to i32
  %256 = bitcast i32 %251 to float
  %257 = bitcast i32 %253 to float
  %258 = bitcast i32 %255 to float
  %259 = bitcast float %257 to i32
  %260 = bitcast float %258 to i32
  %261 = or i32 %259, %260
  %262 = bitcast i32 %261 to float
  %263 = bitcast float %256 to i32
  %264 = bitcast float %262 to i32
  %265 = or i32 %263, %264
  %266 = bitcast i32 %265 to float
  %267 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 11)
  %268 = extractelement <4 x float> %267, i32 0
  %269 = fcmp une float 0x40220F0D80000000, %268
  %270 = select i1 %269, float 1.000000e+00, float 0.000000e+00
  %271 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 11)
  %272 = extractelement <4 x float> %271, i32 1
  %273 = fcmp une float 0xC018E2EB20000000, %272
  %274 = select i1 %273, float 1.000000e+00, float 0.000000e+00
  %275 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 11)
  %276 = extractelement <4 x float> %275, i32 2
  %277 = fcmp une float 0xBFEA8DB8C0000000, %276
  %278 = select i1 %277, float 1.000000e+00, float 0.000000e+00
  %279 = fsub float -0.000000e+00, %270
  %280 = fptosi float %279 to i32
  %281 = fsub float -0.000000e+00, %274
  %282 = fptosi float %281 to i32
  %283 = fsub float -0.000000e+00, %278
  %284 = fptosi float %283 to i32
  %285 = bitcast i32 %280 to float
  %286 = bitcast i32 %282 to float
  %287 = bitcast i32 %284 to float
  %288 = bitcast float %286 to i32
  %289 = bitcast float %287 to i32
  %290 = or i32 %288, %289
  %291 = bitcast i32 %290 to float
  %292 = bitcast float %285 to i32
  %293 = bitcast float %291 to i32
  %294 = or i32 %292, %293
  %295 = bitcast i32 %294 to float
  %296 = insertelement <4 x float> undef, float %208, i32 0
  %297 = insertelement <4 x float> %296, float %237, i32 1
  %298 = insertelement <4 x float> %297, float %266, i32 2
  %299 = insertelement <4 x float> %298, float %295, i32 3
  %300 = insertelement <4 x float> undef, float %208, i32 0
  %301 = insertelement <4 x float> %300, float %237, i32 1
  %302 = insertelement <4 x float> %301, float %266, i32 2
  %303 = insertelement <4 x float> %302, float %295, i32 3
  %304 = call float @llvm.AMDGPU.dp4(<4 x float> %299, <4 x float> %303)
  %305 = bitcast float %304 to i32
  %306 = icmp ne i32 %305, 0
  %307 = sext i1 %306 to i32
  %308 = bitcast i32 %307 to float
  %309 = bitcast float %308 to i32
  %310 = xor i32 %309, -1
  %311 = bitcast i32 %310 to float
  %312 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 12)
  %313 = extractelement <4 x float> %312, i32 0
  %314 = fcmp une float 0xC00574BC60000000, %313
  %315 = select i1 %314, float 1.000000e+00, float 0.000000e+00
  %316 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 12)
  %317 = extractelement <4 x float> %316, i32 1
  %318 = fcmp une float 0x40210068E0000000, %317
  %319 = select i1 %318, float 1.000000e+00, float 0.000000e+00
  %320 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 12)
  %321 = extractelement <4 x float> %320, i32 2
  %322 = fcmp une float 0xBFC9A6B500000000, %321
  %323 = select i1 %322, float 1.000000e+00, float 0.000000e+00
  %324 = fsub float -0.000000e+00, %315
  %325 = fptosi float %324 to i32
  %326 = fsub float -0.000000e+00, %319
  %327 = fptosi float %326 to i32
  %328 = fsub float -0.000000e+00, %323
  %329 = fptosi float %328 to i32
  %330 = bitcast i32 %325 to float
  %331 = bitcast i32 %327 to float
  %332 = bitcast i32 %329 to float
  %333 = bitcast float %331 to i32
  %334 = bitcast float %332 to i32
  %335 = or i32 %333, %334
  %336 = bitcast i32 %335 to float
  %337 = bitcast float %330 to i32
  %338 = bitcast float %336 to i32
  %339 = or i32 %337, %338
  %340 = bitcast i32 %339 to float
  %341 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 13)
  %342 = extractelement <4 x float> %341, i32 0
  %343 = fcmp une float 0xC0119BDA60000000, %342
  %344 = select i1 %343, float 1.000000e+00, float 0.000000e+00
  %345 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 13)
  %346 = extractelement <4 x float> %345, i32 1
  %347 = fcmp une float 0xC02085D640000000, %346
  %348 = select i1 %347, float 1.000000e+00, float 0.000000e+00
  %349 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 13)
  %350 = extractelement <4 x float> %349, i32 2
  %351 = fcmp une float 0xBFD7C1BDA0000000, %350
  %352 = select i1 %351, float 1.000000e+00, float 0.000000e+00
  %353 = fsub float -0.000000e+00, %344
  %354 = fptosi float %353 to i32
  %355 = fsub float -0.000000e+00, %348
  %356 = fptosi float %355 to i32
  %357 = fsub float -0.000000e+00, %352
  %358 = fptosi float %357 to i32
  %359 = bitcast i32 %354 to float
  %360 = bitcast i32 %356 to float
  %361 = bitcast i32 %358 to float
  %362 = bitcast float %360 to i32
  %363 = bitcast float %361 to i32
  %364 = or i32 %362, %363
  %365 = bitcast i32 %364 to float
  %366 = bitcast float %359 to i32
  %367 = bitcast float %365 to i32
  %368 = or i32 %366, %367
  %369 = bitcast i32 %368 to float
  %370 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 14)
  %371 = extractelement <4 x float> %370, i32 0
  %372 = fcmp une float 0x401E1D7DC0000000, %371
  %373 = select i1 %372, float 1.000000e+00, float 0.000000e+00
  %374 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 14)
  %375 = extractelement <4 x float> %374, i32 1
  %376 = fcmp une float 0xC019893740000000, %375
  %377 = select i1 %376, float 1.000000e+00, float 0.000000e+00
  %378 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 14)
  %379 = extractelement <4 x float> %378, i32 2
  %380 = fcmp une float 0x40220F0D80000000, %379
  %381 = select i1 %380, float 1.000000e+00, float 0.000000e+00
  %382 = fsub float -0.000000e+00, %373
  %383 = fptosi float %382 to i32
  %384 = fsub float -0.000000e+00, %377
  %385 = fptosi float %384 to i32
  %386 = fsub float -0.000000e+00, %381
  %387 = fptosi float %386 to i32
  %388 = bitcast i32 %383 to float
  %389 = bitcast i32 %385 to float
  %390 = bitcast i32 %387 to float
  %391 = bitcast float %389 to i32
  %392 = bitcast float %390 to i32
  %393 = or i32 %391, %392
  %394 = bitcast i32 %393 to float
  %395 = bitcast float %388 to i32
  %396 = bitcast float %394 to i32
  %397 = or i32 %395, %396
  %398 = bitcast i32 %397 to float
  %399 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 15)
  %400 = extractelement <4 x float> %399, i32 0
  %401 = fcmp une float 0xC018E2EB20000000, %400
  %402 = select i1 %401, float 1.000000e+00, float 0.000000e+00
  %403 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 15)
  %404 = extractelement <4 x float> %403, i32 1
  %405 = fcmp une float 0xBFEA8DB8C0000000, %404
  %406 = select i1 %405, float 1.000000e+00, float 0.000000e+00
  %407 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 15)
  %408 = extractelement <4 x float> %407, i32 2
  %409 = fcmp une float 0x4015236E20000000, %408
  %410 = select i1 %409, float 1.000000e+00, float 0.000000e+00
  %411 = fsub float -0.000000e+00, %402
  %412 = fptosi float %411 to i32
  %413 = fsub float -0.000000e+00, %406
  %414 = fptosi float %413 to i32
  %415 = fsub float -0.000000e+00, %410
  %416 = fptosi float %415 to i32
  %417 = bitcast i32 %412 to float
  %418 = bitcast i32 %414 to float
  %419 = bitcast i32 %416 to float
  %420 = bitcast float %418 to i32
  %421 = bitcast float %419 to i32
  %422 = or i32 %420, %421
  %423 = bitcast i32 %422 to float
  %424 = bitcast float %417 to i32
  %425 = bitcast float %423 to i32
  %426 = or i32 %424, %425
  %427 = bitcast i32 %426 to float
  %428 = insertelement <4 x float> undef, float %340, i32 0
  %429 = insertelement <4 x float> %428, float %369, i32 1
  %430 = insertelement <4 x float> %429, float %398, i32 2
  %431 = insertelement <4 x float> %430, float %427, i32 3
  %432 = insertelement <4 x float> undef, float %340, i32 0
  %433 = insertelement <4 x float> %432, float %369, i32 1
  %434 = insertelement <4 x float> %433, float %398, i32 2
  %435 = insertelement <4 x float> %434, float %427, i32 3
  %436 = call float @llvm.AMDGPU.dp4(<4 x float> %431, <4 x float> %435)
  %437 = bitcast float %436 to i32
  %438 = icmp ne i32 %437, 0
  %439 = sext i1 %438 to i32
  %440 = bitcast i32 %439 to float
  %441 = bitcast float %440 to i32
  %442 = xor i32 %441, -1
  %443 = bitcast i32 %442 to float
  %444 = load <4 x float> addrspace(8)* null
  %445 = extractelement <4 x float> %444, i32 0
  %446 = fcmp une float 0xC00574BC60000000, %445
  %447 = select i1 %446, float 1.000000e+00, float 0.000000e+00
  %448 = load <4 x float> addrspace(8)* null
  %449 = extractelement <4 x float> %448, i32 1
  %450 = fcmp une float 0x40210068E0000000, %449
  %451 = select i1 %450, float 1.000000e+00, float 0.000000e+00
  %452 = load <4 x float> addrspace(8)* null
  %453 = extractelement <4 x float> %452, i32 2
  %454 = fcmp une float 0xBFC9A6B500000000, %453
  %455 = select i1 %454, float 1.000000e+00, float 0.000000e+00
  %456 = load <4 x float> addrspace(8)* null
  %457 = extractelement <4 x float> %456, i32 3
  %458 = fcmp une float 0xC0119BDA60000000, %457
  %459 = select i1 %458, float 1.000000e+00, float 0.000000e+00
  %460 = fsub float -0.000000e+00, %447
  %461 = fptosi float %460 to i32
  %462 = fsub float -0.000000e+00, %451
  %463 = fptosi float %462 to i32
  %464 = fsub float -0.000000e+00, %455
  %465 = fptosi float %464 to i32
  %466 = fsub float -0.000000e+00, %459
  %467 = fptosi float %466 to i32
  %468 = bitcast i32 %461 to float
  %469 = bitcast i32 %463 to float
  %470 = bitcast i32 %465 to float
  %471 = bitcast i32 %467 to float
  %472 = bitcast float %468 to i32
  %473 = bitcast float %469 to i32
  %474 = or i32 %472, %473
  %475 = bitcast i32 %474 to float
  %476 = bitcast float %470 to i32
  %477 = bitcast float %471 to i32
  %478 = or i32 %476, %477
  %479 = bitcast i32 %478 to float
  %480 = bitcast float %475 to i32
  %481 = bitcast float %479 to i32
  %482 = or i32 %480, %481
  %483 = bitcast i32 %482 to float
  %484 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
  %485 = extractelement <4 x float> %484, i32 0
  %486 = fcmp une float 0xC02085D640000000, %485
  %487 = select i1 %486, float 1.000000e+00, float 0.000000e+00
  %488 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
  %489 = extractelement <4 x float> %488, i32 1
  %490 = fcmp une float 0xBFD7C1BDA0000000, %489
  %491 = select i1 %490, float 1.000000e+00, float 0.000000e+00
  %492 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
  %493 = extractelement <4 x float> %492, i32 2
  %494 = fcmp une float 0x401E1D7DC0000000, %493
  %495 = select i1 %494, float 1.000000e+00, float 0.000000e+00
  %496 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 1)
  %497 = extractelement <4 x float> %496, i32 3
  %498 = fcmp une float 0xC019893740000000, %497
  %499 = select i1 %498, float 1.000000e+00, float 0.000000e+00
  %500 = fsub float -0.000000e+00, %487
  %501 = fptosi float %500 to i32
  %502 = fsub float -0.000000e+00, %491
  %503 = fptosi float %502 to i32
  %504 = fsub float -0.000000e+00, %495
  %505 = fptosi float %504 to i32
  %506 = fsub float -0.000000e+00, %499
  %507 = fptosi float %506 to i32
  %508 = bitcast i32 %501 to float
  %509 = bitcast i32 %503 to float
  %510 = bitcast i32 %505 to float
  %511 = bitcast i32 %507 to float
  %512 = bitcast float %508 to i32
  %513 = bitcast float %509 to i32
  %514 = or i32 %512, %513
  %515 = bitcast i32 %514 to float
  %516 = bitcast float %510 to i32
  %517 = bitcast float %511 to i32
  %518 = or i32 %516, %517
  %519 = bitcast i32 %518 to float
  %520 = bitcast float %515 to i32
  %521 = bitcast float %519 to i32
  %522 = or i32 %520, %521
  %523 = bitcast i32 %522 to float
  %524 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
  %525 = extractelement <4 x float> %524, i32 0
  %526 = fcmp une float 0x40220F0D80000000, %525
  %527 = select i1 %526, float 1.000000e+00, float 0.000000e+00
  %528 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
  %529 = extractelement <4 x float> %528, i32 1
  %530 = fcmp une float 0xC018E2EB20000000, %529
  %531 = select i1 %530, float 1.000000e+00, float 0.000000e+00
  %532 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
  %533 = extractelement <4 x float> %532, i32 2
  %534 = fcmp une float 0xBFEA8DB8C0000000, %533
  %535 = select i1 %534, float 1.000000e+00, float 0.000000e+00
  %536 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 2)
  %537 = extractelement <4 x float> %536, i32 3
  %538 = fcmp une float 0x4015236E20000000, %537
  %539 = select i1 %538, float 1.000000e+00, float 0.000000e+00
  %540 = fsub float -0.000000e+00, %527
  %541 = fptosi float %540 to i32
  %542 = fsub float -0.000000e+00, %531
  %543 = fptosi float %542 to i32
  %544 = fsub float -0.000000e+00, %535
  %545 = fptosi float %544 to i32
  %546 = fsub float -0.000000e+00, %539
  %547 = fptosi float %546 to i32
  %548 = bitcast i32 %541 to float
  %549 = bitcast i32 %543 to float
  %550 = bitcast i32 %545 to float
  %551 = bitcast i32 %547 to float
  %552 = bitcast float %548 to i32
  %553 = bitcast float %549 to i32
  %554 = or i32 %552, %553
  %555 = bitcast i32 %554 to float
  %556 = bitcast float %550 to i32
  %557 = bitcast float %551 to i32
  %558 = or i32 %556, %557
  %559 = bitcast i32 %558 to float
  %560 = bitcast float %555 to i32
  %561 = bitcast float %559 to i32
  %562 = or i32 %560, %561
  %563 = bitcast i32 %562 to float
  %564 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 3)
  %565 = extractelement <4 x float> %564, i32 0
  %566 = fcmp une float 0x4016ED5D00000000, %565
  %567 = select i1 %566, float 1.000000e+00, float 0.000000e+00
  %568 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 3)
  %569 = extractelement <4 x float> %568, i32 1
  %570 = fcmp une float 0x402332FEC0000000, %569
  %571 = select i1 %570, float 1.000000e+00, float 0.000000e+00
  %572 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 3)
  %573 = extractelement <4 x float> %572, i32 2
  %574 = fcmp une float 0xC01484B5E0000000, %573
  %575 = select i1 %574, float 1.000000e+00, float 0.000000e+00
  %576 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 3)
  %577 = extractelement <4 x float> %576, i32 3
  %578 = fcmp une float 0x400179A6C0000000, %577
  %579 = select i1 %578, float 1.000000e+00, float 0.000000e+00
  %580 = fsub float -0.000000e+00, %567
  %581 = fptosi float %580 to i32
  %582 = fsub float -0.000000e+00, %571
  %583 = fptosi float %582 to i32
  %584 = fsub float -0.000000e+00, %575
  %585 = fptosi float %584 to i32
  %586 = fsub float -0.000000e+00, %579
  %587 = fptosi float %586 to i32
  %588 = bitcast i32 %581 to float
  %589 = bitcast i32 %583 to float
  %590 = bitcast i32 %585 to float
  %591 = bitcast i32 %587 to float
  %592 = bitcast float %588 to i32
  %593 = bitcast float %589 to i32
  %594 = or i32 %592, %593
  %595 = bitcast i32 %594 to float
  %596 = bitcast float %590 to i32
  %597 = bitcast float %591 to i32
  %598 = or i32 %596, %597
  %599 = bitcast i32 %598 to float
  %600 = bitcast float %595 to i32
  %601 = bitcast float %599 to i32
  %602 = or i32 %600, %601
  %603 = bitcast i32 %602 to float
  %604 = insertelement <4 x float> undef, float %483, i32 0
  %605 = insertelement <4 x float> %604, float %523, i32 1
  %606 = insertelement <4 x float> %605, float %563, i32 2
  %607 = insertelement <4 x float> %606, float %603, i32 3
  %608 = insertelement <4 x float> undef, float %483, i32 0
  %609 = insertelement <4 x float> %608, float %523, i32 1
  %610 = insertelement <4 x float> %609, float %563, i32 2
  %611 = insertelement <4 x float> %610, float %603, i32 3
  %612 = call float @llvm.AMDGPU.dp4(<4 x float> %607, <4 x float> %611)
  %613 = bitcast float %612 to i32
  %614 = icmp ne i32 %613, 0
  %615 = sext i1 %614 to i32
  %616 = bitcast i32 %615 to float
  %617 = bitcast float %616 to i32
  %618 = xor i32 %617, -1
  %619 = bitcast i32 %618 to float
  %620 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 4)
  %621 = extractelement <4 x float> %620, i32 0
  %622 = fcmp une float 0x40210068E0000000, %621
  %623 = select i1 %622, float 1.000000e+00, float 0.000000e+00
  %624 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 4)
  %625 = extractelement <4 x float> %624, i32 1
  %626 = fcmp une float 0xBFC9A6B500000000, %625
  %627 = select i1 %626, float 1.000000e+00, float 0.000000e+00
  %628 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 4)
  %629 = extractelement <4 x float> %628, i32 2
  %630 = fcmp une float 0xC0119BDA60000000, %629
  %631 = select i1 %630, float 1.000000e+00, float 0.000000e+00
  %632 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 4)
  %633 = extractelement <4 x float> %632, i32 3
  %634 = fcmp une float 0xC02085D640000000, %633
  %635 = select i1 %634, float 1.000000e+00, float 0.000000e+00
  %636 = fsub float -0.000000e+00, %623
  %637 = fptosi float %636 to i32
  %638 = fsub float -0.000000e+00, %627
  %639 = fptosi float %638 to i32
  %640 = fsub float -0.000000e+00, %631
  %641 = fptosi float %640 to i32
  %642 = fsub float -0.000000e+00, %635
  %643 = fptosi float %642 to i32
  %644 = bitcast i32 %637 to float
  %645 = bitcast i32 %639 to float
  %646 = bitcast i32 %641 to float
  %647 = bitcast i32 %643 to float
  %648 = bitcast float %644 to i32
  %649 = bitcast float %645 to i32
  %650 = or i32 %648, %649
  %651 = bitcast i32 %650 to float
  %652 = bitcast float %646 to i32
  %653 = bitcast float %647 to i32
  %654 = or i32 %652, %653
  %655 = bitcast i32 %654 to float
  %656 = bitcast float %651 to i32
  %657 = bitcast float %655 to i32
  %658 = or i32 %656, %657
  %659 = bitcast i32 %658 to float
  %660 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 5)
  %661 = extractelement <4 x float> %660, i32 0
  %662 = fcmp une float 0xBFD7C1BDA0000000, %661
  %663 = select i1 %662, float 1.000000e+00, float 0.000000e+00
  %664 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 5)
  %665 = extractelement <4 x float> %664, i32 1
  %666 = fcmp une float 0x401E1D7DC0000000, %665
  %667 = select i1 %666, float 1.000000e+00, float 0.000000e+00
  %668 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 5)
  %669 = extractelement <4 x float> %668, i32 2
  %670 = fcmp une float 0xC019893740000000, %669
  %671 = select i1 %670, float 1.000000e+00, float 0.000000e+00
  %672 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 5)
  %673 = extractelement <4 x float> %672, i32 3
  %674 = fcmp une float 0x40220F0D80000000, %673
  %675 = select i1 %674, float 1.000000e+00, float 0.000000e+00
  %676 = fsub float -0.000000e+00, %663
  %677 = fptosi float %676 to i32
  %678 = fsub float -0.000000e+00, %667
  %679 = fptosi float %678 to i32
  %680 = fsub float -0.000000e+00, %671
  %681 = fptosi float %680 to i32
  %682 = fsub float -0.000000e+00, %675
  %683 = fptosi float %682 to i32
  %684 = bitcast i32 %677 to float
  %685 = bitcast i32 %679 to float
  %686 = bitcast i32 %681 to float
  %687 = bitcast i32 %683 to float
  %688 = bitcast float %684 to i32
  %689 = bitcast float %685 to i32
  %690 = or i32 %688, %689
  %691 = bitcast i32 %690 to float
  %692 = bitcast float %686 to i32
  %693 = bitcast float %687 to i32
  %694 = or i32 %692, %693
  %695 = bitcast i32 %694 to float
  %696 = bitcast float %691 to i32
  %697 = bitcast float %695 to i32
  %698 = or i32 %696, %697
  %699 = bitcast i32 %698 to float
  %700 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 6)
  %701 = extractelement <4 x float> %700, i32 0
  %702 = fcmp une float 0xC018E2EB20000000, %701
  %703 = select i1 %702, float 1.000000e+00, float 0.000000e+00
  %704 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 6)
  %705 = extractelement <4 x float> %704, i32 1
  %706 = fcmp une float 0xBFEA8DB8C0000000, %705
  %707 = select i1 %706, float 1.000000e+00, float 0.000000e+00
  %708 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 6)
  %709 = extractelement <4 x float> %708, i32 2
  %710 = fcmp une float 0x4015236E20000000, %709
  %711 = select i1 %710, float 1.000000e+00, float 0.000000e+00
  %712 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 6)
  %713 = extractelement <4 x float> %712, i32 3
  %714 = fcmp une float 0x4016ED5D00000000, %713
  %715 = select i1 %714, float 1.000000e+00, float 0.000000e+00
  %716 = fsub float -0.000000e+00, %703
  %717 = fptosi float %716 to i32
  %718 = fsub float -0.000000e+00, %707
  %719 = fptosi float %718 to i32
  %720 = fsub float -0.000000e+00, %711
  %721 = fptosi float %720 to i32
  %722 = fsub float -0.000000e+00, %715
  %723 = fptosi float %722 to i32
  %724 = bitcast i32 %717 to float
  %725 = bitcast i32 %719 to float
  %726 = bitcast i32 %721 to float
  %727 = bitcast i32 %723 to float
  %728 = bitcast float %724 to i32
  %729 = bitcast float %725 to i32
  %730 = or i32 %728, %729
  %731 = bitcast i32 %730 to float
  %732 = bitcast float %726 to i32
  %733 = bitcast float %727 to i32
  %734 = or i32 %732, %733
  %735 = bitcast i32 %734 to float
  %736 = bitcast float %731 to i32
  %737 = bitcast float %735 to i32
  %738 = or i32 %736, %737
  %739 = bitcast i32 %738 to float
  %740 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 7)
  %741 = extractelement <4 x float> %740, i32 0
  %742 = fcmp une float 0x402332FEC0000000, %741
  %743 = select i1 %742, float 1.000000e+00, float 0.000000e+00
  %744 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 7)
  %745 = extractelement <4 x float> %744, i32 1
  %746 = fcmp une float 0xC01484B5E0000000, %745
  %747 = select i1 %746, float 1.000000e+00, float 0.000000e+00
  %748 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 7)
  %749 = extractelement <4 x float> %748, i32 2
  %750 = fcmp une float 0x400179A6C0000000, %749
  %751 = select i1 %750, float 1.000000e+00, float 0.000000e+00
  %752 = load <4 x float> addrspace(8)* getelementptr ([1024 x <4 x float>] addrspace(8)* null, i64 0, i32 7)
  %753 = extractelement <4 x float> %752, i32 3
  %754 = fcmp une float 0xBFEE752540000000, %753
  %755 = select i1 %754, float 1.000000e+00, float 0.000000e+00
  %756 = fsub float -0.000000e+00, %743
  %757 = fptosi float %756 to i32
  %758 = fsub float -0.000000e+00, %747
  %759 = fptosi float %758 to i32
  %760 = fsub float -0.000000e+00, %751
  %761 = fptosi float %760 to i32
  %762 = fsub float -0.000000e+00, %755
  %763 = fptosi float %762 to i32
  %764 = bitcast i32 %757 to float
  %765 = bitcast i32 %759 to float
  %766 = bitcast i32 %761 to float
  %767 = bitcast i32 %763 to float
  %768 = bitcast float %764 to i32
  %769 = bitcast float %765 to i32
  %770 = or i32 %768, %769
  %771 = bitcast i32 %770 to float
  %772 = bitcast float %766 to i32
  %773 = bitcast float %767 to i32
  %774 = or i32 %772, %773
  %775 = bitcast i32 %774 to float
  %776 = bitcast float %771 to i32
  %777 = bitcast float %775 to i32
  %778 = or i32 %776, %777
  %779 = bitcast i32 %778 to float
  %780 = insertelement <4 x float> undef, float %659, i32 0
  %781 = insertelement <4 x float> %780, float %699, i32 1
  %782 = insertelement <4 x float> %781, float %739, i32 2
  %783 = insertelement <4 x float> %782, float %779, i32 3
  %784 = insertelement <4 x float> undef, float %659, i32 0
  %785 = insertelement <4 x float> %784, float %699, i32 1
  %786 = insertelement <4 x float> %785, float %739, i32 2
  %787 = insertelement <4 x float> %786, float %779, i32 3
  %788 = call float @llvm.AMDGPU.dp4(<4 x float> %783, <4 x float> %787)
  %789 = bitcast float %788 to i32
  %790 = icmp ne i32 %789, 0
  %791 = sext i1 %790 to i32
  %792 = bitcast i32 %791 to float
  %793 = bitcast float %792 to i32
  %794 = xor i32 %793, -1
  %795 = bitcast i32 %794 to float
  %796 = bitcast float %91 to i32
  %797 = bitcast float %179 to i32
  %798 = and i32 %796, %797
  %799 = bitcast i32 %798 to float
  %800 = bitcast float %311 to i32
  %801 = bitcast float %443 to i32
  %802 = and i32 %800, %801
  %803 = bitcast i32 %802 to float
  %804 = bitcast float %799 to i32
  %805 = bitcast float %803 to i32
  %806 = and i32 %804, %805
  %807 = bitcast i32 %806 to float
  %808 = bitcast float %619 to i32
  %809 = bitcast float %795 to i32
  %810 = and i32 %808, %809
  %811 = bitcast i32 %810 to float
  %812 = bitcast float %807 to i32
  %813 = bitcast float %811 to i32
  %814 = and i32 %812, %813
  %815 = bitcast i32 %814 to float
  %816 = bitcast float %815 to i32
  %817 = icmp ne i32 %816, 0
  %. = select i1 %817, float 1.000000e+00, float 0.000000e+00
  %.32 = select i1 %817, float 0.000000e+00, float 1.000000e+00
  %818 = insertelement <4 x float> undef, float %0, i32 0
  %819 = insertelement <4 x float> %818, float %1, i32 1
  %820 = insertelement <4 x float> %819, float %2, i32 2
  %821 = insertelement <4 x float> %820, float %3, i32 3
  call void @llvm.R600.store.swizzle(<4 x float> %821, i32 60, i32 1)
  %822 = insertelement <4 x float> undef, float %.32, i32 0
  %823 = insertelement <4 x float> %822, float %., i32 1
  %824 = insertelement <4 x float> %823, float 0.000000e+00, i32 2
  %825 = insertelement <4 x float> %824, float 1.000000e+00, i32 3
  call void @llvm.R600.store.swizzle(<4 x float> %825, i32 0, i32 2)
  ret void
}

declare float @llvm.R600.load.input(i32) #1

declare float @llvm.AMDGPU.dp4(<4 x float>, <4 x float>) #1

declare void @llvm.R600.store.swizzle(<4 x float>, i32, i32)

attributes #0 = { "ShaderType"="1" }
attributes #1 = { readnone }