この記事は「データベーススペシャリスト資格に興味はあるが、どのようなものか?どう学ぶのか?」という方向けに、具体的な内容と私自身の挑戦ログをお伝えする。学び中の方や、これから学ぼうとされる方の参考になれば幸いだ。
今回はSQLによるテーブルの集合演算(3/3)について書く。
※注意点として、SQLはDBMSによって作法が異なる。この記事はGoogle Big Queryに準拠するものであることをお含みおき願いたい。
3つ以上のテーブルの和集合
前回振り返り
- SQLについて。実務では「扱いやすさ」の観点から複数テーブルに分かれているが、分析においては「幅広く見る」ためにテーブルをつなげる必要がある。
- 前回までで「集合演算」の基本と応用を学んだ。具体的には「一定期間ごとの集計レコード」を”縦”につなげる操作としての和集合・積集合・差集合。
- 今回は発展について学ぶ。具体的には3つ以上のテーブルの集合演算。
3つ以上のテーブルの和集合
- 実際にテーブルを用意し、SQLの集合演算を行ってみる。
- たとえば、ある魚屋の売上表(日付、商品名、個数)について、1月分(small_jan)と2月分(small_feb)と3月分(small_mar)があるとする。
- 以上の3つのテーブルを、和集合したSQLは以下のとおり。
- 対象フィールド(列)をproduct_nameに絞り、重複を排除している。
3つ以上のテーブルの積集合
3つ以上のテーブルの和集合
- 先ほどと同様、ある魚屋の売上表(日付、商品名、個数)の1月分(small_jan)、2月分(small_feb)、3月分(small_mar)があるとする。
- 以上の3つのテーブルを、積集合したSQLは以下のとおり。
- 対象フィールド(列)をproduct_nameに絞り、重複部分を作りだしている。
- イメージとしては、ベン図で言えば3つのテーブル(円)が全て重なる部分を抽出しているイメージだ。
複数の集合演算の組み合わせ
和集合の結果から差集合を作成する
- 先ほどと同様、ある魚屋の売上表(日付、商品名、個数)の1月分(small_jan)、2月分(small_feb)、3月分(small_mar)があるとする。
- 3月分から「1月分と2月分の和集合」を引いた差集合を求めるSQLは以下のとおり。
- ポイントとしては、SQLの3~5行目をカッコで括り先に処理していること。
- 集合演算の順序もカッコで設定できる。
考察
SQLについて
- 分析においては、実務上複数に分かれているテーブルをつなげる必要がある。
- 今回は「一定期間ごとの集計レコード」を”縦”につなげる操作「集合演算」の発展を学んだ。具体的には3つ以上のテーブルの集合演算や、異なる集合演算の組み合わせ。
考察
- 考察。今後も「ITが生活に浸透⇒データが集まる⇒AIの有効活用」はすすむ。たとえば生命保険の契約は高額・長期なので、申込手続きも長らく書面だった。しかし現在はタブレットで申込可能になり、それにより手続きの一連データが取得でき、AIを活用した見込み客分析などが可能になった。
- そこで大事なのは「IT、データ、AIを使いこなし」「それらで代替できない能力も磨く」ことだと感じる。たとえばITコンサルは「主に企業の問題をITで解決する」ため、ITの幅広い知見やデータ分析による裏付けと、顧客の価値観や業務フロー等の「概念」からくみ取った意味をコラボする。
- 私は高度IT資格を中心に学んでいるが、これは「IT等を使いこなす」基礎として幅広く学び、視野を広げる目的がある。また「IT等で代替できない能力を磨く」ための読解力を養う目的もある。これらを本業で生きた知識として実践しつつ、ブログ×Twitterの発信で定着していきたい。
考察にあたっての書籍の引用「10年度に食える仕事 食えない仕事」
- AIと人間の協働(コラボレーション)により高い成果を上げるのが「デジタル・ケンタウロス」エリアの職業群である。
- 具体的にはコンサルタント・カウンセラー・デザイナー・臨床医など。
- 今後はデジタルデバイドにより入口段階(デジタル・分析可能・環境整備された馬の部分)で差がつく。
- そして第2段階で残されたアートの部分(信用・感情・創造などの人の部分)でさらに差がつく。
- なおこのエリアには、グローバル化によって「無国籍ジャングル」となる職業と、日本語障壁や日本文化によって高いハードルがあり外国人との競争から守られる「グローカル」の両方がある。
考察にあたっての書籍の引用「AI vs 教科書が読めない子どもたち」
- 「推論」は文の構造を理解した上で、生活体験や常識、様々な知識を総動員して文章の意味を理解する力です。
- 「イメージ同定」は、文章と図形やグラフを比べて、内容が一致しているかどうかを認識する能力です。
- 「具体例同定」は定義を読んでそれと合致する具体例を認識する能力です。
- この3つは、意味を理解しないAIでは全く歯がたちません。
参考書籍
- 集中演習 SQL入門/木田和廣/株式会社インプレス
- データベーススペシャリスト2022年版/三好康之/翔泳社
- おうちで学べるデータベースのきほん/ミック,木村明治/翔泳社
- 10年度に食える仕事 食えない仕事/渡邉正裕/東洋経済新報社
- AI vs 教科書が読めない子どもたち/新井紀子/東洋経済
コメント