CPU向けの最適化したらえらい速くなったらしい

LLaMA Now Goes Faster on CPUs
https://justine.lol/matmul/