sigmaの日記

日々思ったことをつらつらと書きます。

主成分分析と線形回帰

 主成分分析は、データの情報損失を最小とするような基底を見つける。これに対して、線形回帰は、仮説(線形モデル)に最も良くフィットする仮説のパラメタを探す。

 ときどき思うのは、与えられた2次元データに対して直線をフィットしたとき、フィットしたあとの見た目からは、どちらの方法を使ったのかが分からないということである。アルゴリズムの詳細まで知らない初心者が、線形回帰と主成分分析による直線のフィッティングの差を明確に説明できるだろうか。そもそも、主成分分析と線形回帰は目指すゴールが異なっている。それは前述の通りである。さらに言えば、主成分分析は、説明変数と被説明変数の間の関係性をモデル化するのではなく、「単に」データの情報損失が最小になるような写像を見出すだけである。つまり、データの各次元に何らかの関係性を仮定しない。これに対して、線形回帰は、与えられたデータの次元の間に何らかの関係性が要請されている。つまり、xがyを説明する、といったことである。この点も、これらの手法で大きく違っている点のひとつであろう。また、技術的には、説明変数に誤差が含まれている場合、線形回帰は適さないが、主成分分析は問題なく適用できる(説明変数という考え方をしない)。

 線形回帰は、ある現象を説明するための良いモデルを見出す(良い説明変数を見出す)ために用いられるのに対し、主成分分析は、データを良く代表する新たな基底を見出すため、次元削減のために用いられる。

最近、自炊する回数を増やした。

 今までは、食堂で食べたり、スーパーのお惣菜を食べることが多かった。それはそれで、料理の手間が省けて良い。また、食堂で食べたり、お惣菜を買ったりすることと、自炊することを比べると、自炊するほうがコストが高い。もう少し厳密には、ずっと自炊を続けるならば、コストは抑えられるが、そうでない、たまにしか自炊しないなら、外食や惣菜よりコストが高くなるのである。なぜなら、食料を買いだすときには、たいてい、玉ねぎや人参なんかはセットで販売されていて、もちろん、バラ売りよりは一個あたりの値段が抑えられているものの、それでもそれなりの値段である。さらに、たまにしか自炊しない人は、セットで買うと余らせてしまうのである。また、醤油や味噌などの調味料を購入するコストがかかることも無視できない。

 この間、お正月に帰省した折、久しぶりに実家で手料理を食べていると、やはり、手料理も良いものだと思った。味付けも自分好みにできるし、自分の食べたいものを食べたい量だけ作ることができる。そういうわけで、あっさり行動指針を変更し、今まではほぼ完全に外食、惣菜派だったのだが、考えを変えて、積極的に自炊している。

 自炊は、基本的に夜ご飯であるが、あまったおかずは翌朝に繰り越すことができるので、これは一石二鳥と言えよう。