explainer¶

Feature explanation generator using LLM.

Generates human-readable explanations for features.

`FeatureExplainer` ¶

Generate human-readable explanations for features.

Uses LLM to create interpretable explanations that can be understood by non-technical stakeholders.

Parameters:

Name	Type	Description	Default
`model`	`str`	LLM model to use	`'gpt-5.2'`

Examples:

>>> explainer = FeatureExplainer()
>>> explanations = explainer.explain_features(feature_set, task='predict churn')

Source code in featcopilot/llm/explainer.py

class FeatureExplainer:
    """
    Generate human-readable explanations for features.

    Uses LLM to create interpretable explanations that can be
    understood by non-technical stakeholders.

    Parameters
    ----------
    model : str, default='gpt-5.2'
        LLM model to use

    Examples
    --------
    >>> explainer = FeatureExplainer()
    >>> explanations = explainer.explain_features(feature_set, task='predict churn')
    """

    def __init__(self, model: str = "gpt-5.2", verbose: bool = False):
        self.model = model
        self.verbose = verbose
        self._client: Optional[SyncCopilotFeatureClient] = None

    def _ensure_client(self) -> None:
        """Ensure client is initialized."""
        if self._client is None:
            self._client = SyncCopilotFeatureClient(model=self.model)
            self._client.start()

    def explain_feature(
        self,
        feature: Feature,
        column_descriptions: Optional[dict[str, str]] = None,
        task_description: Optional[str] = None,
    ) -> str:
        """
        Generate explanation for a single feature.

        Parameters
        ----------
        feature : Feature
            Feature to explain
        column_descriptions : dict, optional
            Descriptions of source columns
        task_description : str, optional
            ML task description

        Returns
        -------
        explanation : str
            Human-readable explanation
        """
        self._ensure_client()

        explanation = self._client.explain_feature(
            feature_name=feature.name,
            feature_code=feature.code or feature.transformation,
            column_descriptions=column_descriptions,
            task_description=task_description,
        )

        return explanation

    def explain_features(
        self,
        features: FeatureSet,
        column_descriptions: Optional[dict[str, str]] = None,
        task_description: Optional[str] = None,
        batch_size: int = 5,
    ) -> dict[str, str]:
        """
        Generate explanations for multiple features.

        Parameters
        ----------
        features : FeatureSet
            Features to explain
        column_descriptions : dict, optional
            Descriptions of source columns
        task_description : str, optional
            ML task description
        batch_size : int, default=5
            Number of features to explain in each LLM call

        Returns
        -------
        explanations : dict
            Mapping of feature names to explanations
        """
        explanations = {}

        for feature in features:
            # Skip if already has explanation
            if feature.explanation:
                explanations[feature.name] = feature.explanation
                continue

            try:
                explanation = self.explain_feature(feature, column_descriptions, task_description)
                explanations[feature.name] = explanation
                feature.explanation = explanation

            except Exception as e:
                if self.verbose:
                    logger.error(f"Could not explain {feature.name}: {e}")
                explanations[feature.name] = f"Feature based on: {', '.join(feature.source_columns)}"

        return explanations

    def generate_feature_report(
        self,
        features: FeatureSet,
        X: pd.DataFrame,
        column_descriptions: Optional[dict[str, str]] = None,
        task_description: Optional[str] = None,
    ) -> str:
        """
        Generate a comprehensive report about features.

        Parameters
        ----------
        features : FeatureSet
            Features to report on
        X : DataFrame
            Data with features
        column_descriptions : dict, optional
            Descriptions of source columns
        task_description : str, optional
            ML task description

        Returns
        -------
        report : str
            Markdown-formatted report
        """
        explanations = self.explain_features(features, column_descriptions, task_description)

        report = "# Feature Engineering Report\n\n"

        if task_description:
            report += f"**Task:** {task_description}\n\n"

        report += f"**Total Features Generated:** {len(features)}\n\n"

        # Summary by origin
        report += "## Features by Origin\n\n"
        origins = {}
        for feature in features:
            origin = feature.origin.value
            origins[origin] = origins.get(origin, 0) + 1

        for origin, count in sorted(origins.items()):
            report += f"- {origin}: {count}\n"

        # Feature details
        report += "\n## Feature Details\n\n"

        for feature in features:
            report += f"### {feature.name}\n\n"
            report += f"- **Type:** {feature.dtype.value}\n"
            report += f"- **Origin:** {feature.origin.value}\n"
            report += f"- **Source Columns:** {', '.join(feature.source_columns)}\n"

            if feature.name in X.columns:
                report += f"- **Non-null Values:** {X[feature.name].notna().sum()}\n"
                if X[feature.name].dtype in ["float64", "int64"]:
                    report += f"- **Mean:** {X[feature.name].mean():.4f}\n"
                    report += f"- **Std:** {X[feature.name].std():.4f}\n"

            explanation = explanations.get(feature.name, "")
            if explanation:
                report += f"\n**Explanation:** {explanation}\n"

            if feature.code:
                report += f"\n**Code:**\n```python\n{feature.code}\n```\n"

            report += "\n"

        return report

    def __del__(self):
        """Clean up client."""
        if self._client:
            try:
                self._client.stop()
            except Exception:
                pass

`del()` ¶

Clean up client.

Source code in featcopilot/llm/explainer.py

def __del__(self):
    """Clean up client."""
    if self._client:
        try:
            self._client.stop()
        except Exception:
            pass

`explain_feature(feature, column_descriptions=None, task_description=None)` ¶

Generate explanation for a single feature.

Parameters:

Name	Type	Description	Default
`feature`	`Feature`	Feature to explain	required
`column_descriptions`	`dict`	Descriptions of source columns	`None`
`task_description`	`str`	ML task description	`None`

Returns:

Name	Type	Description
`explanation`	`str`	Human-readable explanation

Source code in featcopilot/llm/explainer.py

def explain_feature(
    self,
    feature: Feature,
    column_descriptions: Optional[dict[str, str]] = None,
    task_description: Optional[str] = None,
) -> str:
    """
    Generate explanation for a single feature.

    Parameters
    ----------
    feature : Feature
        Feature to explain
    column_descriptions : dict, optional
        Descriptions of source columns
    task_description : str, optional
        ML task description

    Returns
    -------
    explanation : str
        Human-readable explanation
    """
    self._ensure_client()

    explanation = self._client.explain_feature(
        feature_name=feature.name,
        feature_code=feature.code or feature.transformation,
        column_descriptions=column_descriptions,
        task_description=task_description,
    )

    return explanation

`explain_features(features, column_descriptions=None, task_description=None, batch_size=5)` ¶

Generate explanations for multiple features.

Parameters:

Name	Type	Description	Default
`features`	`FeatureSet`	Features to explain	required
`column_descriptions`	`dict`	Descriptions of source columns	`None`
`task_description`	`str`	ML task description	`None`
`batch_size`	`int`	Number of features to explain in each LLM call	`5`

Returns:

Name	Type	Description
`explanations`	`dict`	Mapping of feature names to explanations

Source code in featcopilot/llm/explainer.py

def explain_features(
    self,
    features: FeatureSet,
    column_descriptions: Optional[dict[str, str]] = None,
    task_description: Optional[str] = None,
    batch_size: int = 5,
) -> dict[str, str]:
    """
    Generate explanations for multiple features.

    Parameters
    ----------
    features : FeatureSet
        Features to explain
    column_descriptions : dict, optional
        Descriptions of source columns
    task_description : str, optional
        ML task description
    batch_size : int, default=5
        Number of features to explain in each LLM call

    Returns
    -------
    explanations : dict
        Mapping of feature names to explanations
    """
    explanations = {}

    for feature in features:
        # Skip if already has explanation
        if feature.explanation:
            explanations[feature.name] = feature.explanation
            continue

        try:
            explanation = self.explain_feature(feature, column_descriptions, task_description)
            explanations[feature.name] = explanation
            feature.explanation = explanation

        except Exception as e:
            if self.verbose:
                logger.error(f"Could not explain {feature.name}: {e}")
            explanations[feature.name] = f"Feature based on: {', '.join(feature.source_columns)}"

    return explanations

`generate_feature_report(features, X, column_descriptions=None, task_description=None)` ¶

Generate a comprehensive report about features.

Parameters:

Name	Type	Description	Default
`features`	`FeatureSet`	Features to report on	required
`X`	`DataFrame`	Data with features	required
`column_descriptions`	`dict`	Descriptions of source columns	`None`
`task_description`	`str`	ML task description	`None`

Returns:

Name	Type	Description
`report`	`str`	Markdown-formatted report

Source code in featcopilot/llm/explainer.py

def generate_feature_report(
    self,
    features: FeatureSet,
    X: pd.DataFrame,
    column_descriptions: Optional[dict[str, str]] = None,
    task_description: Optional[str] = None,
) -> str:
    """
    Generate a comprehensive report about features.

    Parameters
    ----------
    features : FeatureSet
        Features to report on
    X : DataFrame
        Data with features
    column_descriptions : dict, optional
        Descriptions of source columns
    task_description : str, optional
        ML task description

    Returns
    -------
    report : str
        Markdown-formatted report
    """
    explanations = self.explain_features(features, column_descriptions, task_description)

    report = "# Feature Engineering Report\n\n"

    if task_description:
        report += f"**Task:** {task_description}\n\n"

    report += f"**Total Features Generated:** {len(features)}\n\n"

    # Summary by origin
    report += "## Features by Origin\n\n"
    origins = {}
    for feature in features:
        origin = feature.origin.value
        origins[origin] = origins.get(origin, 0) + 1

    for origin, count in sorted(origins.items()):
        report += f"- {origin}: {count}\n"

    # Feature details
    report += "\n## Feature Details\n\n"

    for feature in features:
        report += f"### {feature.name}\n\n"
        report += f"- **Type:** {feature.dtype.value}\n"
        report += f"- **Origin:** {feature.origin.value}\n"
        report += f"- **Source Columns:** {', '.join(feature.source_columns)}\n"

        if feature.name in X.columns:
            report += f"- **Non-null Values:** {X[feature.name].notna().sum()}\n"
            if X[feature.name].dtype in ["float64", "int64"]:
                report += f"- **Mean:** {X[feature.name].mean():.4f}\n"
                report += f"- **Std:** {X[feature.name].std():.4f}\n"

        explanation = explanations.get(feature.name, "")
        if explanation:
            report += f"\n**Explanation:** {explanation}\n"

        if feature.code:
            report += f"\n**Code:**\n```python\n{feature.code}\n```\n"

        report += "\n"

    return report

explainer¶

FeatureExplainer ¶

__del__() ¶

explain_feature(feature, column_descriptions=None, task_description=None) ¶

explain_features(features, column_descriptions=None, task_description=None, batch_size=5) ¶

generate_feature_report(features, X, column_descriptions=None, task_description=None) ¶

`FeatureExplainer` ¶

`del()` ¶

`explain_feature(feature, column_descriptions=None, task_description=None)` ¶

`explain_features(features, column_descriptions=None, task_description=None, batch_size=5)` ¶

`generate_feature_report(features, X, column_descriptions=None, task_description=None)` ¶