GENmemcpy.S 2.4 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141
  1. /* GENmemcpy.S: Generic sparc64 memcpy.
  2. *
  3. * Copyright (C) 2007 David S. Miller ([email protected])
  4. */
  5. #ifdef __KERNEL__
  6. #include <linux/linkage.h>
  7. #define GLOBAL_SPARE %g7
  8. #else
  9. #define GLOBAL_SPARE %g5
  10. #endif
  11. #ifndef EX_LD
  12. #define EX_LD(x,y) x
  13. #endif
  14. #ifndef EX_ST
  15. #define EX_ST(x,y) x
  16. #endif
  17. #ifndef LOAD
  18. #define LOAD(type,addr,dest) type [addr], dest
  19. #endif
  20. #ifndef STORE
  21. #define STORE(type,src,addr) type src, [addr]
  22. #endif
  23. #ifndef FUNC_NAME
  24. #define FUNC_NAME GENmemcpy
  25. #endif
  26. #ifndef PREAMBLE
  27. #define PREAMBLE
  28. #endif
  29. #ifndef XCC
  30. #define XCC xcc
  31. #endif
  32. .register %g2,#scratch
  33. .register %g3,#scratch
  34. .text
  35. #ifndef EX_RETVAL
  36. #define EX_RETVAL(x) x
  37. ENTRY(GEN_retl_o4_1)
  38. add %o4, %o2, %o4
  39. retl
  40. add %o4, 1, %o0
  41. ENDPROC(GEN_retl_o4_1)
  42. ENTRY(GEN_retl_g1_8)
  43. add %g1, %o2, %g1
  44. retl
  45. add %g1, 8, %o0
  46. ENDPROC(GEN_retl_g1_8)
  47. ENTRY(GEN_retl_o2_4)
  48. retl
  49. add %o2, 4, %o0
  50. ENDPROC(GEN_retl_o2_4)
  51. ENTRY(GEN_retl_o2_1)
  52. retl
  53. add %o2, 1, %o0
  54. ENDPROC(GEN_retl_o2_1)
  55. #endif
  56. .align 64
  57. .globl FUNC_NAME
  58. .type FUNC_NAME,#function
  59. FUNC_NAME: /* %o0=dst, %o1=src, %o2=len */
  60. srlx %o2, 31, %g2
  61. cmp %g2, 0
  62. tne %XCC, 5
  63. PREAMBLE
  64. mov %o0, GLOBAL_SPARE
  65. cmp %o2, 0
  66. be,pn %XCC, 85f
  67. or %o0, %o1, %o3
  68. cmp %o2, 16
  69. blu,a,pn %XCC, 80f
  70. or %o3, %o2, %o3
  71. xor %o0, %o1, %o4
  72. andcc %o4, 0x7, %g0
  73. bne,a,pn %XCC, 90f
  74. sub %o0, %o1, %o3
  75. and %o0, 0x7, %o4
  76. sub %o4, 0x8, %o4
  77. sub %g0, %o4, %o4
  78. sub %o2, %o4, %o2
  79. 1: subcc %o4, 1, %o4
  80. EX_LD(LOAD(ldub, %o1, %g1),GEN_retl_o4_1)
  81. EX_ST(STORE(stb, %g1, %o0),GEN_retl_o4_1)
  82. add %o1, 1, %o1
  83. bne,pt %XCC, 1b
  84. add %o0, 1, %o0
  85. andn %o2, 0x7, %g1
  86. sub %o2, %g1, %o2
  87. 1: subcc %g1, 0x8, %g1
  88. EX_LD(LOAD(ldx, %o1, %g2),GEN_retl_g1_8)
  89. EX_ST(STORE(stx, %g2, %o0),GEN_retl_g1_8)
  90. add %o1, 0x8, %o1
  91. bne,pt %XCC, 1b
  92. add %o0, 0x8, %o0
  93. brz,pt %o2, 85f
  94. sub %o0, %o1, %o3
  95. ba,a,pt %XCC, 90f
  96. .align 64
  97. 80: /* 0 < len <= 16 */
  98. andcc %o3, 0x3, %g0
  99. bne,pn %XCC, 90f
  100. sub %o0, %o1, %o3
  101. 1:
  102. subcc %o2, 4, %o2
  103. EX_LD(LOAD(lduw, %o1, %g1),GEN_retl_o2_4)
  104. EX_ST(STORE(stw, %g1, %o1 + %o3),GEN_retl_o2_4)
  105. bgu,pt %XCC, 1b
  106. add %o1, 4, %o1
  107. 85: retl
  108. mov EX_RETVAL(GLOBAL_SPARE), %o0
  109. .align 32
  110. 90:
  111. subcc %o2, 1, %o2
  112. EX_LD(LOAD(ldub, %o1, %g1),GEN_retl_o2_1)
  113. EX_ST(STORE(stb, %g1, %o1 + %o3),GEN_retl_o2_1)
  114. bgu,pt %XCC, 90b
  115. add %o1, 1, %o1
  116. retl
  117. mov EX_RETVAL(GLOBAL_SPARE), %o0
  118. .size FUNC_NAME, .-FUNC_NAME