この記事は「データベーススペシャリスト資格に興味はあるが、どのようなものか?どう学ぶのか?」という方向けに、具体的な内容と私自身の挑戦ログをお伝えする。学び中の方や、これから学ぼうとされる方の参考になれば幸いだ。
今回はSQLにおける数値の丸めについて書く。なお、SQL(データ分析)はあくまで目的を達成するための手段だ。例えば売り上げ増加を目的に、顧客の購入歴から筋の良い商品をSQLを使って分析するなどだ。このように「目的に沿ってデータを集め、整理、比較、分析、仮説検証する手法」が統計学であり、意味のあるデータ分析に欠かせない要素だ。よって目的を見失わないようにするため、複数回に分けて統計学の基礎をおさらいする。
また、そのような「データを用いた分析・検証」を抽象概念に汎化して、日常生活でも応用(特化)できればなお良い。かみ砕いて言えば学びをふだんづかいするということだ。そこで日常生活の事例についてデータを用いた考察をおこなってみる。
※注意点として、SQLはDBMSによって作法が異なる。この記事はGoogle Big Queryに準拠するものであることをお含みおき願いたい。
SQL(関数による数値の丸め)
前回振り返り
- SQLについて。「仮想テーブル」を扱う操作に関して「with句」「ビュー」「サブクエリ」を一通り学習できた。前回は復習のため確認ドリルを解いた。
- 今回は関数による数値の丸めについて学ぶ。
数値を丸める(単一データ)
- 切り捨てにはfloor関数(floor(フィールド名)で使う。該当フィールド内の値よりも小さい、最大の整数値を返す)
- 切り上げにはceil関数(ceil(フィールド名)で使う。該当フィールド内の値以上で、最小の整数値を返す)
- 四捨五入にはround関数(round(フィールド名,桁数)で使う。桁数を省略すると一の位で丸める。桁数を指定するとその桁数で丸める)
- SQL実例は以下のとおり。「12345.6789」を持つテーブルをwith句で作成し、それを引き込みfloor,ceil,roundで各々処理した結果を表示
数値を丸める(複数データ)
- 上のSQLを拡張して、様々な数値を丸めてみたSQL実例は以下のとおり。
- ポイントとして、floorは「より小さい方向」、ceilは「より大きい方向」、roundは「近い整数」に丸められていると考えると、値がマイナスのときも理解しやすい。
- なお、select句とunion allで計算結果を縦につなげてテーブルを作る方法(以下、赤枠)は、わざわざcsvからアップロードしてテーブルを作るまでもないときに有効なテクニック。
統計の基礎①(統計を学ぶ意味)
なぜ統計を学ぶのか
- なぜ統計を学ぶのか。人によって理由は様々だと思う。ただ、「より良い人生を送りたいか?」と聞かれたら大半の人が「はい」と答えるだろう。
- より良い人生を送るには、まず自分にとって何が「良い」のか把握する必要がある(これを一般的に価値観と言う)。
- そのうえで、何らかの行動を起こすときに価値観に沿って、自分で考えて判断する必要がある。このときに役立つのが統計の概念である。
具体例(大学選びに正解はあるか)
- 具体例を挙げよう。例えば「安定した生活が大事。だから年収はそこそこ必要」という人が、「大学に進学するか否か?行くならどの大学か?」を決めるとする。
- このとき判断理由が「親の意見」「周囲の意見」のような「他人軸」だと、上手くいかなかったとき後悔する懸念がある。また「この大学に進学すれば年収が高くなる(らしい)」のような「根拠があいまいな自分軸」だと判断を誤る可能性が高い。
- よって、ある程度自分で大学と年収に関するデータを集め、その関係を把握し、それもふまえて自分で決めるのが望ましい。つまり「ある程度裏付けのある自分軸」で判断するということだ。
- なお、当然ながら良い大学に行ったら必ず高年収が約束される訳ではない。つまり大学と年収に因果関係(2つの事柄のうち、一方が原因で一方が結果であること)はない。
- ただ、相関関係(2つの事柄に関係はあるものの、因果関係があるとは言えない)はある。これは例えば厚生労働省の賃金基本構造統計調査などのデータを見れば明らかだ。
- よってたとえば「この大学に行けば絶対収入が安定するとは言えない。ただ、過去の統計データや相関から見て収入が安定する可能性はある。だから、いま時間と費用をかけて大学に進学するのとあわせて、その大学で自分らしく努力することが大切だ」という一歩踏み込んだ考え方も、統計の概念を踏まえれば可能ということだ。
- 参考までに、経済学の有力な研究では、大学の偏差値と年収の間に統計上有意な因果関係がないことを示している。その論文研究者のコメントは「問題は、どこが最高の大学か、ということではない。問題は、誰にとって最高の大学か、なのだ」であり、非常に示唆深い。
データを用いた考察(企業勤めを続けるべきか)
問題の設定
- 私ごとで恐縮だが、私は今の企業に入社しておおむね勤続20年となる。この勤続年数が比較的めずらしい部類であることは、以前確認した(過去記事はこちら)。
- さて、今の労働条件(業務内容・報酬・勤務時間・勤務地・社風・職場の人間関係等)に大きな不満はないのだが、日系大企業特有の業務の細分化・パターン化と現状維持の継続が、新しい領域(社外・外国・新技術)の経験・スキル不足を引き起こし、DX推進などにおいて「業務上の問題」を顕在化させているとは感じる。
- 具体的には不明確さ(ゴールや指示内容が曖昧)、不自由さ(タスクや時間に個人の裁量がない)、達成感や貢献の実感不足(社内調整や役員報告が主になり、計画そのものに集中できない)などだ。
- 私自身も業務内容によっては「価値が感じづらい仕事に長時間拘束される」ことに疲弊することもある。そこで今回は「私は、今のまま企業勤めしたほうが良いのか」を考える。
結論
- 給与・退職金・年金の面で見て、経済面では企業勤めが望ましい。
- ただし、自分の心身と家族のケアを第一に、労働時間と職務内容について主体的に働きかけ、改善していくことが重要だ。例えば育児時短や育児休業などの活用、社内公募制度や自己研鑽支援制度の活用、副業(許可されている場合)の実施などだ。
調査データ(経済面)
- 勤続年数と給与には正の相関関係が見られる。例えば資本金10億円以上の株式会社における「勤続年数と平均年間給与(男性)」を見ると、10~14年が690万、15~19年が770万、20~24年が840万であり、勤続34年まで増加傾向にある(上昇率は徐々に緩やかになるが)。実際、私も10年前と現在の給与を比較したが時間あたり給与は増加傾向にあった。つまり勤続20年であれば、今の企業で働き方を見直すほうが、転職や独立より給与は安定する可能性が高いと考えられる。(参考データ:民間給与実態統計の第14表 企業規模別及び勤続年数別の給与所得者数・給与額)
- 次に、給与と厚生年金額には正の相関関係が見られる。厚生年金の計算式は簡略化すれば「保険料納付期間中の平均賃金×保険料納付年数×生年月日等による係数」だからだ。また、前述のとおり勤続年数と給与は正の相関があるので、例えば勤続40年と勤続25年では厚生年金額に2倍近い差が出る可能性もある(前者は月額14万、後者は月額6万など)。また、厚生年金の保険料は労使折半であり、支払も会社が行ってくれる点も見逃せない。つまり勤続20年であれば、企業勤め継続が厚生年金は安定すると考えられる。(参考データ:厚生年金保険・国民年金事業統計)
- さらに、勤続年数と退職金には正の相関関係が見られる。たとえば「平成13年民間企業退職金実態調査」によれば、勤続年数20年の退職一時金を100とした場合、5年は18、10年は41、15年は68、20年は100、25年は135、30年は169と、勤続年数20年辺りを境に急上昇しているのが分かる。歴史が古い日系企業ほどこの傾向はありそうだ。一方、外資系のベンチャー企業など「退職金を払わない代わりに月々の給与が高い」場合はその限りではない。いずれにせよ大手日系企業で勤続20年であれば、企業勤め継続が退職金は安定すると考えられる。(参考データ:平成13年民間企業退職金実態調査)
調査データ(健康面)
- さて、経済面だけでなく健康面も気にする必要がある。私の会社は「金融・保険業」であるが、「令和2年賃金構造基本統計調査」によれば、「産業別の賃金を見ると金融・保険業が最も高い。ただし賃金カーブを見ると50~54歳がピークでありそこから大きく下降する」ことが分かる。(参考データ:令和2年賃金構造基本統計調査の概況第5図)
- ここで仮説として「金融・保険業は、給与が高いぶん激務なので、長く働くことが難しいのではないか」が挙がる。そこでe-Statで「職業 and ストレス」で検索し「労働安全衛生調査」を見ると、大企業かつ金融・保険業は長時間労働・メンタルヘルス不全の割合が高いことが分かる。事実、私の同期や他社の仲間を見ても、その傾向が伺える。(参考データ:労働安全衛生調査)
- ここから分かることは、もし大企業かつ金融・保険業で勤続20年以降も働こうと思うなら、自分の心身と家族との時間を第一に考え、労働時間・メンタルヘルス環境は自分で改善するという主体性が大事ということだ。
考察
- SQLについて。これまで基礎(基本構文・グループ化・複数テーブル・仮想テーブル)を学び、実際に記述できるようになった。そこで応用としてSQL関数を少しづつ学んでいく。今回は「数値の丸め」に関して学んだ。
- 考察。目的に沿ったデータ分析には統計の概念が必須のため、少しづつおさらいする。今回は「なぜ統計を学ぶのか?」について、大学の偏差値と年収の関係を例に考察した。これに係る研究者の「問題は、どこが最高の大学か、ということではない。問題は、誰にとって最高の大学か、なのだ」は至言と思う。
- また、「学びのふだん使い」として「勤続20年近いが仕事がキツいこともある。私は企業勤めを続けるべきか?」を例に考察した。結論は「給与・年金・退職金などの経済面では企業勤めが望ましい。ただし、自分の心身と家族のケアを第一に、労働時間や職務内容への主体的な改善取り組みが重要」だ。
考察のシンプル化と英訳(練習中)
- I try to decide the important thing myself with my values and solid data.
- (私は、重要なことは自分で決めようと心掛けています。自分の価値観と確かなデータに沿って)
参考書籍
- 集中演習 SQL入門/木田和廣/株式会社インプレス
- 原因と結果の経済学/中室牧子,津川友介/ダイヤモンド社
- 意味がわかる統計学/石井俊全/ベレ出版
コメント