本当はデータをカチャカチャする仕事がしたかった話

はてなブログアプリから「今月のアクセス数が1,000越えたで、おめでとうやで」って通知が来た。ひえぇ…これ全部、昨日投稿したデータサイエンティストについての、あの記事のおかげです。

いつの間にかTwitterでご紹介にあがっており…本当にありがとうございます。あんな頭悪そうな文章の記事でホンマにもう…目を通していただけた方にも、感謝の気持ちでいっぱいです。

メンヘラ日記の中にぽつんとデータサイエンティストに関する記事があって、不自然に思われたかもしれないので、自分がどういう立場だったのかを、今更ながらちょっとここで補足しておこうかなと。

 

私はデータ分析のお手伝いさんだった。

この4年間ほどは、マーケティングをやっている客先に常駐し、IBM SPSS Modelerを使ってデータのクレンジング・加工、統計知識が必要ない程度のレポート作成、ごくたま~にModelerの機械学習ノードにデータを突っ込んでみて決定木とかクラスタ分析とかアソシエーション分析とか。そんな仕事をしていた。

SPSS Modeler - 概要 - 日本 | IBM

 

もっと昔、元々は一般事務の派遣社員だった。Excel VBAが書けることから「Excelの得意な派遣さん」として割と重宝されて働いていた。

そしてVBAを使ってサイズの大きなCSVファイルから必要なデータだけ取り出し、社内DBにインポートするだとか、コンサルで「ArcGIS」という地理情報分析ツールを使うだとかしている内に、「でっかいデータをカチャカチャして形にするの、超面白いぞ!」ということに気がついてしまった。

今後はデータ分析の一歩手前、データの処理加工を自分の仕事にしたいな~、という野望を抱き、幸運にもデータ分析を売りにするSIer?みたいな会社に契約社員として潜り込むことができたのが、5年前のこと。

 

このとき、既に35才。

  • ガチの文系(大学では近代文学やってました)
  • 高校時代の数学は2(ただし大人になってから、暗記が苦手なのであって数式にはあまり抵抗ないことに気づく)
  • 当然、統計とかさっぱり。「漫画でわかる統計学」の『検定』で思いっきり蹴躓きました。
  • まともに書けるプログラムはExcel VBA。応用でAccessも。SQLDML(データ操作)なら、まあ大丈夫かなあ? コマンドプロンプトとかもちょろっと書いたりして、未熟なりにコーディング自体は好き。

この程度のスキルしかなく、そしてその後もSPSS Modelerをメインで使っていたため、RやPythonSASなどのコーディングによるデータ処理を身につけないまま、5年の歳月を過ごしてしまった。

pythonをやらなかったのが本当に悔やまれる…2年前の勉強会で触ったときは「楽しい!」と思ったのに、学習を継続できなかった)

 

いろいろあって「うつ」で体調を崩して休養後、この1ヶ月ほど転職活動してたんだけど、世間では「データサイエンティスト」しか募集しておらず、私のような下っ端ポジションはどこにも求められていない。

理由はわかってる。現在データサイエンティストは注目の職業で、理系の新卒がこぞって押し寄せているのだ。現場ではOJTと称して、下っ端仕事は全部彼ら若手に委ねられている。

ろくにコーディングもできない、40のオバサンの居場所はなかった。私の「データをカチャカチャする仕事」の野望、ここに完!

 

こんなレベルの低い人間なので、昨日みたいにデータサイエンティストについて語るなどと片腹痛し! ということは重々承知だけれども…それでも。

優秀なデータサイエンティストが、たくさん活躍できる世の中ならば、私のやりたかったデータ分析の下っ端仕事ができるチャンスがあったのかもって。

そう思うと、やっぱりデータ分析回りの話は気になるし、語ってみたくなってしまったのだ。

 

明日から、データ分析とは関係のない新しい仕事が始まる。もう戻れはしないのだろう。未練はあるけれど、こればっかりは、勉強を怠りスキルを磨かなかった自分が悪い。

だからせめて、データサイエンスや分析のお仕事をされるみなさんのご活躍をお祈りしたい。確かに今はバブルなのかもしれないけれど、長期的に見ればAIやデータ分析の普及は、紙とペンしかなかったオフィスをパソコンが席巻したように、携帯やスマートフォンが誰にとっても欠かせない道具になったように、私たちの社会に存在していることが当たり前のものとなるだろう。そしてそれを支えるのはデータサイエンティストのみなさんなのだ。データサイエンスの未来に幸あれ!