Related to: Machine Learning

Torch.mm vs Torch.matmul 차이점

  • torch.matmul
    • torch.matmul은 broadcast를 지원합니다.
  • torch.mm
    • torch.mm은 broadcast를 지원하지 않습니다.
    • 따라서 mm은 정확하게 matrix 곱의 사이즈가 맞아야 사용이 가능합니다.
  • Broadcast
    • broadcast 기능은 아래의 예제와 같이 T1(10, 3, 4) T2(4)을 곱할 때, 맨 앞의 dim이 3개 일 때는 첫 dim을 batch로 간주하고 T1 (3, 4) tensor의 10개의 batch와 각각 T2(4)랑 곱을 해주는 것입니다.

      Untitled 57.png

참조

https://neos518.tistory.com/178

Week 2