推論モデルのトークン消費