排総研ブログ

投稿

ラベル（#因果推論）が付いた投稿を表示しています

GAN（Generative Adversarial Network）を用いた因果探索の実装

投稿者: ★排泄ケア相談員の認定試験問題集★ 7/11/2025

GAN（Generative Adversarial Network）を用いた因果探索の実装コードの目的因果構造データの生成サンプルデータには、 X1 -> X2 -> X3 の因果構造を仮定しています。 GAN を使用したデータ生成 GAN で生成したデータが、元の因果構造をどの程度再現できるか確認します。 DAG の描画真の因果構造（ DAG ）を視覚化。背景 GAN を用いる因果探索では、生成モデルがデータの分布を再現し、それを基に因果構造を明らかにするアプローチが採られます。生成されたデータを更に解析することで、新たな因果関係の発見や因果ネットワークの推定が可能です。このコードは基礎的な例で、実際の応用では、生成データと実データ間の因果一致をさらに詳しく評価する必要があります。引用アドレス　 https://deus-ex-machina-ism.com/?p=52535&amp=1 GAN （ Generative Adversarial Network ）を用いた因果探索の実装は、生成モデルと因果関係推定の組み合わせを活用する高度なアプローチです。以下に、シンプルな GAN を利用して因果構造の学習を行う例を示します。この例では、因果構造を暗黙的に学習し、生成されるデータを基に解析します。コード例 GAN で因果探索以下は、 GAN を活用して因果グラフを推定する簡単な例です。 python import numpy as np import tensorflow as tf from tensorflow.keras import layers import networkx as nx import matplotlib.pyplot as plt # データ生成（因果構造に基づくサンプルデータ） def generate_data(n_samples): x1 = np.random.uniform(-1, 1, n_samples) x2 = 2 * x1 + np.ra...

EconMLの因果探索例

投稿者: ★排泄ケア相談員の認定試験問題集★ 7/10/2025

EconML 概要 EconML は、 Microsoft Research の ALICE チームによって開発されたライブラリで、観察データから異質な治療効果を推定するために機械学習技術を適用し、経済学と機械学習の交差点に焦点を当てています。特徴推定方法ダブルマシンラーニング（線形、スパース線形、汎用 ML ）動的ダブルマシンラーニング因果フォレスト（ Causal Forests ）直交ランダムフォレスト（ Orthogonal Random Forests ）メタラーナー（ XLearner, SLearner, TLearner ）ダブルロバストラーナー（線形、スパース線形、非パラメトリック）計器変数を使用したダブルマシンラーニング（直交、非パラメトリック）計器変数を使用したダブルロバストマシンラーニング（線形、スパース線形、非パラメトリック、線形 ITT ）深層計器変数（ Deep Instrumental Variables ）解釈可能性 CATE モデルのツリー解釈 CATE モデルの政策解釈 SHAP 値による CATE モデルの解釈因果モデル選択とクロスバリデーション RScorer を使用した因果モデル選択ファーストステージモデル選択推論効果推論サマリー人口サマリーパラメータ推論サマリー政策学習 DRPolicyTree, DRPolicyForest によるダブルロバスト政策学習適用例 : A/B テストの推薦、顧客セグメンテーション、多投資帰属分析などに使用。詳細は EconML のドキュメントで確認できます。 !pip install dowhy !pip install econml %load_ext autoreload %autoreload 2 import numpy as np import pandas as pd import logging import dowhy from d...

PythonのDoWhyライブラリを用いた因果探索の実装コード例を示します！

投稿者: ★排泄ケア相談員の認定試験問題集★ 7/09/2025

DoWhy 概要 DoWhy は、因果グラフィカルモデルと潜在的結果フレームワークを統合し、因果仮定の明示的なモデリングとテストをサポートするライブラリです。 PyWhy プロジェクトの一環として開発されています。特徴効果推定因果効果の特定、平均因果効果（ ACE ）、条件付き平均因果効果（ CACE ）の推定、計器変数（ instrumental variables ）の使用。因果影響の定量化メディエーション分析（媒介効果の評価）、直接的な矢印の強度、内在的な因果影響の分析。 What-if 分析介入分布からのサンプルの生成、反事実（ counterfactuals ）の推定。根本原因分析と説明異常の原因特定、分布変化の原因探索、特徴の関連性の評価。適用例 : ビジネスメトリクスの改善や異常検知、因果関係の可視化に適しており、 Microsoft や Amazon などの企業で利用されています。詳細は DoWhy のドキュメントで確認できます。 Python の DoWhy ライブラリを用いた因果探索の実装コード例を示します。このコードでは、シンプルなデータセットを使って因果 DoWhy は Python の因果推論ライブラリであり、統計的因果推論のためのフレームワークを提供しています。 DoWhy 因果グラフの構築、傾向スコアの推定、因果効果の推定などの機能を備えている。グラフを構築し、因果効果を推定します。 DoWhy による因果探索コード !pip install dowhy import numpy as np import pandas as pd from dowhy import CausalModel # サンプルデータ生成 np.random.seed(42) n_samples = 500 # データフレーム作成 data = pd.DataFrame({ "Treatment": np...

因果構造探索でDirectLiNGAMの4つの条件を再確認

投稿者: ★排泄ケア相談員の認定試験問題集★ 7/08/2025

因果探索と DirectLiNGAM って何？まず、因果探索とは、データを使って「何が何に影響しているか」を発見する技術です。例えば、「勉強時間が成績に影響するのかな？」とか「睡眠時間が気分に影響するのかな？」といった関係を、データから見つけ出すことを目指します。その中で DirectLiNGAM （ダイレクト・リンガム）は、因果探索の方法の一つで、特に以下のような特徴を持つデータに使われます。線形　変数同士の関係が直線的（比例するような関係）。非ガウス　データが正規分布（釣り鐘型の分布）じゃない。 DirectLiNGAM は、変数間の因果関係を矢印でつながれたグラフ（有向グラフ）として表し、それをデータから推定します。でも、これがちゃんと動くためには、 4 つの条件を満たす必要があります。それでは、その条件を一つずつ見ていきましょう！ DirectLiNGAM の 4 つの条件？ DirectLiNGAM が因果関係を正しく見つけるためには、次の 4 つの条件が大事です。線形性（ Linearity ）非ガウス性（ Non-Gaussianity ）非巡回性（ Acyclicity ）独立な誤差項（ Independent Error Terms ）それぞれを具体例と一緒に、わかりやすく説明します。 1. 線形性（ Linearity ）どんな条件？変数同士の因果関係が直線的な関係であることを前提にしています。つまり、ある変数が別の変数に影響を与えるとき、その影響が比例する形で表されるということです。具体例たとえば、勉強時間（ X ）と成績（ Y ）の関係を考えてみましょう。もし勉強時間が 1 時間増えるごとに、成績が一定の割合で上がる（例えば、 1 時間増えると 5 点アップ）なら、これは線形な関係です。数学で書くと、こんな感じになります： Y = aX + b + 誤差（ここで、 a は影響の強さ、 b は定数、誤差はランダムなズレです）なぜ大事？ DirectLiNGAM は、変数間の関係が直線的だと仮定して作られているので、もしデータがこの条件を満たさない（たとえば、勉強時間が成績に影響するけど増えすぎると逆に下がる、みたいな複雑な関係）だと、正しい因果関係を見つけられ...

DirectLiNGAMって何？

投稿者: ★排泄ケア相談員の認定試験問題集★ 7/07/2025

DirectLiNGAM って何？ DirectLiNGAM は、データから「何が何に影響を与えているか」（因果関係）を調べる方法の一つです。例えば、「お菓子を食べすぎると体重が増える」みたいな関係を、データを使って見つけるイメージです。この手法は、 LiNGAM モデルという仕組みをベースにしていて、それを「直接的に学ぶ」やり方です。さらに、エントロピーというものを使います。エントロピーって難しそうに聞こえますが、ここでは「データのバラバラ具合や予測の難しさ」を測る目安だと思えば OK です。これを使って、データの中に隠れている「ランダムな影響」（誤差）がお互いに独立しているかどうかをチェックします。 LiNGAM モデルって何？その基本ルール LiNGAM モデルは、因果関係を調べるための土台となる仕組みで、 4 つの大事なルール（仮定）があります。このルールが成り立つと、因果関係を正しく見つけやすくなります。それぞれを簡単に説明しますね。 1. 直線性意味　変数同士の関係が「まっすぐな線」で表せるということ。例　お菓子を食べる量が 1 袋増えるごとに、体重が 0.5 キロ増える、みたいなシンプルな関係。曲がりくねったりせず、一直線で影響し合うイメージです。 2. 非ガウス連続誤差変数（最大 1 つを除く）意味　データに影響を与える「ランダムな要因」（誤差）が、普通の「正規分布」（きれいなベル型のグラフ）じゃない形をしていること。ただし、 1 つだけ例外があっても OK 。なぜ大事？　正規分布だと、どっちが原因でどっちが結果かわかりにくい。でも、非ガウス（ちょっと変わった形）だと、因果の方向が特定しやすくなります。例：体重に影響する誤差が、生活習慣やストレスみたいにランダムだけど偏ったパターンを持つ場合。 3. 非循環性意味　因果関係に「ぐるぐる回るループ」がないこと。例　お菓子を食べると体重が増え、体重が増えるとまたお菓子を食べる … みたいな循環はなし。一方向（お菓子 → 体重）だけです。これで、関係を矢印でスッキリ書けます。 4. 隠れた共通の原因はない意味　見えない要因が複数のデータに同時に影響していないこと。例　体重とお菓子のデータを見ているとき、見えない「ストレス」が両...

causalMLによる因果探索コード例

投稿者: ★排泄ケア相談員の認定試験問題集★ 7/05/2025

!pip install causalml import pandas as pd import numpy as np from causalml.inference.meta import BaseTRegressor from sklearn.ensemble import RandomForestRegressor # サンプルデータ生成 np.random.seed(42) n_samples = 500 # データフレーム作成 data = pd.DataFrame({ "Treatment": np.random.choice([0, 1], size=n_samples), # 介入変数 "Outcome": np.random.normal(size=n_samples), # 結果変数 ( 連続値 ) "Confounder_A": np.random.normal(size=n_samples), # 交絡因子 1 "Confounder_B": np.random.normal(size=n_samples), # 交絡因子 2 }) # 因果推定モデルの構築 confounders = ["Confounder_A", "Confounder_B"] model = BaseTRegressor(learner=RandomForestRegressor()) # Regression モデルに変更 # モデルの学習 X = data[confounders] y = data["Outcome"] w = data["Treatment"] model.fit(X=X, treatment=w, y=y) # 因果効果の推定 te = model.predict(X=X) print(f"Estimated treatment effect: {te.mean(...