2020/4/22 特に意味のない実験をしていた

A8バナー広告

最初からまとめ

  • クライアントに実験結果を示すときは、「なぜこの実験をやったのか?」を示すこと。
  • 報告書を書く時は、曖昧な言葉を使っていない?と要チェック。
  • 株式に関する語の単語を少し覚えた。

なぜこの実験をやったのか?

クライントの担当者に「この実験の目的は何?」と質問された。

タスク内容は「正解データを作成すること」だった。

実はこの正解データというのが少し曲者で、「母集団とは異なるデータ集合」だったする。

正解データは意図的に母集団とは異なる分布になっている

このタスク設定では、ほとんどがTrueラベルになってしまって、Falseラベルのデータを見つける方が大変。

そこで正解データセットでは、意図的にFalseになりやすいデータをサンプリングしてきて、アノテーションして、正解データセットとしていた。

この正解データセットを使って、仮にモデルの実験をしたら何か意味はあるだろうか・・?まぁ、タスクによっては意味は出るかもしれない。

今回のケースでは、「正解データセットを作ったから、おまけで実験もしました」くらいの気持ちだった。

つまり、実験自体にそれほど意味はない。

担当者の質問とおり「この実験に意味はあるのか?」を先に考えておけば、無駄な作業時間は削減できたかもしれない。反省。

ちなみに、正解データセットを意図的に母集団と違う分布でサンプリングしてきたのには、タスク上の理由がある。書かないけれど。

また曖昧な言葉つかってるー。

報告書の中で、ぼくは「サンプル」という言葉を書いていた。

クライアント担当者から、ぼくの書く「サンプル」には2つの意味があると、指摘される。

  1. 正解データセットの中で1データレコードのことを指すゴールドデータ
  2. 機械学習モデルの結果にあたる1予測結果

そもそも「サンプル」という言葉自体がミスチョイスだったが。

報告書を書くときは、2つの意味を持っていないことを確認しないと。

ドイツ語の株式用語を調べた

Trade Republicというオンライン証券サービスを登録してみた。

サービスは使えるようになったが、で配当金に関する情報を見ることができない。

結局、原因は証券口座にお金を入れていないことだった。

Q&Aを調べる中で次の単語を覚えた。

  • Dividenden: 配当金
  • Dividenden und Eträgnisse: 配当金と収入
  • die Behörden: 手数料
  • Dividendenbeleg: 配当金受け取り領収書