データサイエンス,と俺

とある大学院生がデータサイエンティストに成るまでのお話.しかし成れるかどうかは別のお話.

学習のまとめ

Texの二段組み文章における画像の配置について

この前の記事で最近論文っぽいものを書いていると言ったけど,それはTexを使って書いているのです.実はワタクシTex初心者でして,色々と調べながらやっていたんだけど,その中で昨日特に苦労したことがあったので,他に同じ悩みを持つかもしれない人のため…

続・Rも後一歩足りない

昨日は適当に書き過ぎたので,今日はもう少し丁寧に何が足りなかったのかを書こうと思う. やりたいこと 決定木のCARTというアルゴリズムを使った分析.さらにCARTで作った木の枝刈り(pruning)や各変数の重要度(feature importance)算出もやりたい. python…

比較・検証も簡単ではない

昨日の記事の通り,今日は実際にデータを使って比較・検証を行うって話でしたが,実際にやってみるとなかなか難しい. データを探すのが大変 まず,分析に使うデータの選定が難しい.データは無償公開されているUCI Machine Learning Repositoryから探してい…

正則化って何ぞや?

今日から2日間くらいで,「正則化」について勉強したまとめを載せようと思います.方針としては,まず簡単に正則化について説明し,その後,正則化回帰分析について簡単な説明と検証を行う形でいこうと思います. *注* 今回の記事の中には間違った記述が…