というよりも、介入や効果の推定が目的だから測定値をそのまま変数として使うことが多かったのが統計における歴史かな
分野によるだろうけど、重回帰分析も交絡を統制したときの注目する変数の振る舞いを見たいのがモチベーションで説明や予測が目的ではない時代が長かった
その場合、モデル作成を繰り返すのはp-hackということもあるし、予測能力が改善したところで注目する変数の係数は大幅には変わらないからエンジニアリングはあんましない
対数変換やビニングくらいはするけれども

機械学習の場合、NN系なんかは特にだけど、そもそも変数がどのように作用しているかをモデルから知ることが出来なかったのと、画像認識などは入力を従来の変数とは呼び難いのが特徴量なる用語が生まれた背景なんだろう
知らんけど