データサイエンス,と俺

とある大学院生がデータサイエンティストに成るまでのお話.しかし成れるかどうかは別のお話.

2013-11-01から1ヶ月間の記事一覧

価値観の変化

大学院に入って新しく始めたことがある.それは「ピアノ」だ.実は大学の時からやりたいと思っていたんだけど,簡単に飽きてしまうかもしれないのに,高い楽器を買うのは嫌だと思ってずっとやらずにいた. そのピアノだけど,実際に始めてみるとかなりハマっ…

積極的選択

人生において選択を迫られる機会は多いけど,特に人生を大きく左右するであろう選択においては,各選択肢のメリット・デメリットを考えたり,何らかの選択肢を選んだ場合における将来図のシミュレーションを入念に行ったりすると思う. これまでの俺は,客観…

飯の問題

基本的に自炊をするのがメンドウなんで外食ばかりしているんですが,最近外食に行くのが辛くなってきた.たぶん外食特有の濃い味付けに飽きてきたのかもしれない.しかし,だからといって自炊をするのはメンドウだし,自炊して作る物も結果的に味が濃くなっ…

R使っちゃおうかな

これまでの研究では,pythonのscikit-learnというパッケージを主に使用していて特に問題もなかったんですが,ついに問題にぶつかってしまいました. その問題を解決すべく色々探してみると,Rを使えば解決できるということが判明.これまで難解という理由でR…

一緒にやるのが良い

研究にしても,コンテストなんかにしても,一人で黙々とやるよりも誰かと一緒にやったほうが俺はいいと思う. 一人でやってると,やったことの責任を取るのが自分だけだから,研究を適当にやるのも,コンテストを辞退するのも簡単. 二人以上でやることで,…

果物

果物の中では,俺は梨とメロンが好きです.理由は美味しいのと,食べるのが楽なところ.スイカみたいなメンドウくさい食べ物は嫌いです. そういえば,最近カットフルーツがいろんな所で販売されてるのを見る気がします.スーパーだけじゃなくて,ローソンと…

必要とされるものは何なのか

大学院まで来ると,何も考えずに就活して働くというわけにもいかない.自分がどのような能力を持ち,どんな風に役に立てるかということを主張できなくてはならない.そんな時に考えるのが,「社会が必要としているもの」とは何なのか?ということだ. 研究と…

文章を書く事の難しさ

最近,文章を書く機会が増えている.そうすると,自分がいかに文章を書く能力が低いのかを思い知らされる. 無駄に修飾したり,いい接続詞が思い浮かばなかったりするのは茶飯事で,ひどい場合には「日本語が難しいのが悪い!」と匙を投げてしまう. どうす…

行動記録を付けると面白い

半年前くらいからGoogleカレンダーに日々の行動記録をアバウトに付けている.その記録を見ると,いかに自分が研究に時間を使わずグダグダしているのかがわかる.こういった事実を記録として正しく認識してしまうと,「忙しいんで」とか「時間無いんで」のよ…

夜行性新人類の可能性?

昨日から今日にかけて徹夜してしまった.といっても,朝から起きてて徹夜というわけではなくて,昼に起きてそこから今まで起きてる感じです. こうやって,たまに徹夜して生活リズムを直そうと試みるものの,すぐに夜型に戻ってしまう.なぜ夜型に戻ってしま…

いいデータ転がってないかな?

手法のテストに色々なデータを使っているんですが,なかなか面白い結果を出してくれるデータはないもので,苦労している.しかも稀にいい結果を出す事が合っても,そういうデータは外部に公開できない奴だったりする. あ〜いいデータ転がってないか?

準備は大切

結局今日も比較・検証の結果をのせることはできません! そもそも,「分かりやすいように纏める」ということを舐めていたようです.学習したことを奇麗に纏めて文字に起すには,ある程度正しい理解が出来ていないと無理なわけです.そして正しい理解をするた…

比較・検証も簡単ではない

昨日の記事の通り,今日は実際にデータを使って比較・検証を行うって話でしたが,実際にやってみるとなかなか難しい. データを探すのが大変 まず,分析に使うデータの選定が難しい.データは無償公開されているUCI Machine Learning Repositoryから探してい…

正則化って何ぞや?

今日から2日間くらいで,「正則化」について勉強したまとめを載せようと思います.方針としては,まず簡単に正則化について説明し,その後,正則化回帰分析について簡単な説明と検証を行う形でいこうと思います. *注* 今回の記事の中には間違った記述が…

人にわかるように勉強結果をまとめるのは難しい

実は,今日の記事は「正則化」というものに関する勉強結果をまとめたものを紹介するつもりだったんですが,記事を書き始めると,書いては直し,書いては直し,を繰り返すだけで先に進まず,そうこうしてる間に今日が終わりそうになっているではないですか!…

サーベイって大変ね!

最近は学会発表のためのアブストを書いているけど,イントロの部分に結構手間取っている.というかメンドウ! 特に既存研究と絡めて自分の研究の必要性を説くところなんかは,既存研究にどんなのがあるかを調べるだけで大変.好き放題言わせてほしいですわ!…

とりあえず自己紹介

俺の素性 データマイニング・機械学習系の研究室に所属する大学院生. ブログを始めた理由は,何か新しいことをやろう!?と思ったからかな. このブログの主な目的 ・データサイエンスに関する日々の学習日記 ・たまに何かを分析して,その過程や結果につい…