そういう場合分けじゃなくてmemcpyの場合わけみたいな奴
大きなレジスタが使える状況なら使ってガーっと処理して端数はバイト単位でやるとか
特定の命令セットの有無で処理を分けるとか