データベーススペシャリスト資格|2022年10月挑戦ログ 5月12日|SQLによるテーブルの集合(3/3)

高度IT・基礎知識

この記事は「データベーススペシャリスト資格に興味はあるが、どのようなものか?どう学ぶのか?」という方向けに、具体的な内容と私自身の挑戦ログをお伝えする。学び中の方や、これから学ぼうとされる方の参考になれば幸いだ。

今回はSQLによるテーブルの集合演算(3/3)について書く。

※注意点として、SQLはDBMSによって作法が異なる。この記事はGoogle Big Queryに準拠するものであることをお含みおき願いたい。

3つ以上のテーブルの和集合

前回振り返り

  • SQLについて。実務では「扱いやすさ」の観点から複数テーブルに分かれているが、分析においては「幅広く見る」ためにテーブルをつなげる必要がある。
  • 前回までで「集合演算」の基本と応用を学んだ。具体的には「一定期間ごとの集計レコード」を”縦”につなげる操作としての和集合・積集合・差集合。
  • 今回は発展について学ぶ。具体的には3つ以上のテーブルの集合演算

3つ以上のテーブルの和集合

  • 実際にテーブルを用意し、SQLの集合演算を行ってみる。
  • たとえば、ある魚屋の売上表(日付、商品名、個数)について、1月分(small_jan)と2月分(small_feb)と3月分(small_mar)があるとする。
  • 以上の3つのテーブルを、和集合したSQLは以下のとおり
  • 対象フィールド(列)をproduct_nameに絞り、重複を排除している。

3つ以上のテーブルの積集合

3つ以上のテーブルの和集合

  • 先ほどと同様、ある魚屋の売上表(日付、商品名、個数)の1月分(small_jan)、2月分(small_feb)、3月分(small_mar)があるとする。
  • 以上の3つのテーブルを、積集合したSQLは以下のとおり
  • 対象フィールド(列)をproduct_nameに絞り、重複部分を作りだしている。
  • イメージとしては、ベン図で言えば3つのテーブル(円)が全て重なる部分を抽出しているイメージだ。

複数の集合演算の組み合わせ

和集合の結果から差集合を作成する

  • 先ほどと同様、ある魚屋の売上表(日付、商品名、個数)の1月分(small_jan)、2月分(small_feb)、3月分(small_mar)があるとする。
  • 3月分から「1月分と2月分の和集合」を引いた差集合を求めるSQLは以下のとおり。
  • ポイントとしては、SQLの3~5行目をカッコで括り先に処理していること。
  • 集合演算の順序もカッコで設定できる

考察

SQLについて

  • 分析においては、実務上複数に分かれているテーブルをつなげる必要がある。
  • 今回は「一定期間ごとの集計レコード」を”縦”につなげる操作「集合演算」の発展を学んだ。具体的には3つ以上のテーブルの集合演算や、異なる集合演算の組み合わせ。

考察

  • 考察。今後も「ITが生活に浸透⇒データが集まる⇒AIの有効活用」はすすむ。たとえば生命保険の契約は高額・長期なので、申込手続きも長らく書面だった。しかし現在はタブレットで申込可能になり、それにより手続きの一連データが取得でき、AIを活用した見込み客分析などが可能になった。
  • そこで大事なのは「IT、データ、AIを使いこなし」「それらで代替できない能力も磨く」ことだと感じる。たとえばITコンサルは「主に企業の問題をITで解決する」ため、ITの幅広い知見やデータ分析による裏付けと、顧客の価値観や業務フロー等の「概念」からくみ取った意味をコラボする。
  • 私は高度IT資格を中心に学んでいるが、これは「IT等を使いこなす」基礎として幅広く学び、視野を広げる目的がある。また「IT等で代替できない能力を磨く」ための読解力を養う目的もある。これらを本業で生きた知識として実践しつつ、ブログ×Twitterの発信で定着していきたい。

考察にあたっての書籍の引用「10年度に食える仕事 食えない仕事」

  • AIと人間の協働(コラボレーション)により高い成果を上げるのが「デジタル・ケンタウロス」エリアの職業群である。
  • 具体的にはコンサルタント・カウンセラー・デザイナー・臨床医など。
  • 今後はデジタルデバイドにより入口段階(デジタル・分析可能・環境整備された馬の部分)で差がつく。
  • そして第2段階で残されたアートの部分(信用・感情・創造などの人の部分)でさらに差がつく。
  • なおこのエリアには、グローバル化によって「無国籍ジャングル」となる職業と、日本語障壁や日本文化によって高いハードルがあり外国人との競争から守られる「グローカル」の両方がある。

考察にあたっての書籍の引用「AI vs 教科書が読めない子どもたち」

  • 「推論」は文の構造を理解した上で、生活体験や常識、様々な知識を総動員して文章の意味を理解する力です。
  • 「イメージ同定」は、文章と図形やグラフを比べて、内容が一致しているかどうかを認識する能力です。
  • 「具体例同定」は定義を読んでそれと合致する具体例を認識する能力です。
  • この3つは、意味を理解しないAIでは全く歯がたちません。

参考書籍

  • 集中演習 SQL入門/木田和廣/株式会社インプレス
  • データベーススペシャリスト2022年版/三好康之/翔泳社
  • おうちで学べるデータベースのきほん/ミック,木村明治/翔泳社
  • 10年度に食える仕事 食えない仕事/渡邉正裕/東洋経済新報社
  • AI vs 教科書が読めない子どもたち/新井紀子/東洋経済

コメント

タイトルとURLをコピーしました