[t:/]$ 지식_

불도저

2017/03/31

틈틈히 (-.-) simd, avx2를 보고 있는데... 불도저(AMD)에는 있는 삼항연산이 인텔엔 없다.. 없어.. 없어 이 ㅅ끼야... a = b * c + d가 FMA4에서는 1인스트럭션으로 처리된다.. 우야뜬 AVX2만으로 MLP의 뭔가를 최적화를 한 뎁쓰만 해봤는데 O3 보다 3배 빠르다... 이 자랑은 나중에 정리해서 정리된 자랑으로 올려보겠습니다.

머신러닝의 많은 연산에서 b * c + d가 필요하다. 이것을 한 인스트럭션으로 제공한다는 것은 매우 훌륭하다는 거시다.. gpu 프로그래밍은 아직 못해봤는디.. 그짝 세계도 빨리 까보고 싶따... 그런데 내 맥프로는 내장글픽.. 아놔..





공유하기













[t:/] is not "technology - root". dawnsea, rss