Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

https://github.com/ModelOriented/fairmodels

Flexible tool for bias detection, visualization, and mitigation
https://github.com/ModelOriented/fairmodels

explain-classifiers explainable-ml fairness fairness-comparison fairness-ml model-evaluation

Last synced: 2 months ago
JSON representation

Flexible tool for bias detection, visualization, and mitigation

Host: GitHub
URL: https://github.com/ModelOriented/fairmodels
Owner: ModelOriented
License: gpl-3.0
Created: 2020-03-28T21:30:09.000Z (about 4 years ago)
Default Branch: master
Last Pushed: 2022-08-29T08:05:11.000Z (almost 2 years ago)
Last Synced: 2024-01-25T16:05:09.502Z (5 months ago)
Topics: explain-classifiers, explainable-ml, fairness, fairness-comparison, fairness-ml, model-evaluation
Language: R
Homepage: https://fairmodels.drwhy.ai/
Size: 142 MB
Stars: 82
Watchers: 7
Forks: 15
Open Issues: 3
Metadata Files:
- Readme: README.md
- License: LICENSE

Lists

awesome-machine-learning-interpretability - fairmodels

README

        # fairmodels  

  

  [![Codecov test coverage](https://codecov.io/gh/ModelOriented/fairmodels/branch/master/graph/badge.svg)](https://app.codecov.io/gh/ModelOriented/fairmodels?branch=master)

  [![R build status](https://github.com/ModelOriented/fairmodels/workflows/R-CMD-check/badge.svg)](https://github.com/ModelOriented/fairmodels/actions)

   [![CRAN](https://www.r-pkg.org/badges/version/fairmodels)](https://cran.r-project.org/package=fairmodels)

   ![Downloads](https://cranlogs.r-pkg.org/badges/fairmodels)

   [![DrWhy-eXtrAI](https://img.shields.io/badge/DrWhy-eXtrAI-4378bf)](http://drwhy.ai/#eXtraAI)

  

  

  

## Overview

Flexible tool for bias detection, visualization, and mitigation. Use models explained with [DALEX](https://modeloriented.github.io/DALEX/) and calculate fairness classification metrics based on confusion matrices using `fairness_check()` or try newly developed module for regression models using `fairness_check_regression()`. R package fairmodels allows to compare and gain information about various machine learning models. Mitigate bias with various pre-processing and post-processing techniques. *Make sure your models are classifying protected groups similarly*.

## Preview

![preview](man/figures/preview.gif)

## Installation

Install it from CRAN:

```

install.packages("fairmodels")

```

or developer version from GitHub:

```

devtools::install_github("ModelOriented/fairmodels")

```

## Example

Checking fairness is easy! 

```

library(fairmodels)

library(ranger)

library(DALEX)

data("german")

# ------------ step 1 - create model(s)  -----------------

lm_model <- glm(Risk~.,

                data = german,

                family=binomial(link="logit"))

rf_model <- ranger(Risk ~.,

                   data = german,

                   probability = TRUE,

                   num.trees = 200)

# ------------  step 2 - create explainer(s)  ------------

# numeric y for explain function

y_numeric <- as.numeric(german$Risk) -1

explainer_lm <- explain(lm_model, data = german[,-1], y = y_numeric)

explainer_rf <- explain(rf_model, data = german[,-1], y = y_numeric)

# ------------  step 3 - fairness check  -----------------

fobject <- fairness_check(explainer_lm, explainer_rf,

                          protected = german$Sex,

                          privileged = "male")

 

print(fobject)

plot(fobject)

```

Compas recidivism data use case: [Basic tutorial](https://modeloriented.github.io/fairmodels/articles/Basic_tutorial.html)   

Bias mitigation techniques on Adult data: [Advanced tutorial](https://modeloriented.github.io/fairmodels/articles/Advanced_tutorial.html)

## How to evaluate fairness in classification models? 







### Fairness checking is flexible

`fairness_check` parameters are    

* x, ...  - `explainers` and `fairness_objects` (products of fairness_check).   

* protected - factor with different subgroups as levels. Usually specific race, sex etc...   

* privileged - subgroup, base on which to calculate parity loss metrics.    

* cutoff  - custom cutoff, might be single value - cutoff same for all subgroups or vector - for each subgroup individually. Affecting only explainers.   

* label - character vector for every explainer.   

Models might be trained on different data, even without protected variable. May have different cutoffs which gives different values of metrics. 

`fairness_check()` is place where `explainers` and `fairness_objects` are checked for compatibility and then glued together.  

So it is possible to to something like this: 

```

fairness_object <- fairness_check(explainer1, explainer2, ...)

fairness_object <- fairness_check(explainer3, explainer4, fairness_object, ...)

```

even with more `fairness_objects`!

If one is even more keen to know how `fairmodels` works and what are relations between objects, please look at this diagram [class diagram](https://github.com/ModelOriented/fairmodels/blob/master/man/figures/class_diagram.png)

## Metrics used

There are 12 metrics based on confusion matrix : 

| Metric | Formula | Full name | fairness names while checking among subgroups |

|--------|---------|-----------|-------------|

| TPR | ![tpr](man/figures/formulas/tpr.jpg) | true positive rate | equal opportunity

| TNR | ![tnr](man/figures/formulas/tnr.jpg) | true negative rate | 

| PPV | ![ppv](man/figures/formulas/ppv.jpg) | positive predictive value | predictive parity

| NPV | ![npv](man/figures/formulas/npv.jpg) | negative predictive value | 

| FNR | ![fnr](man/figures/formulas/fnr.jpg) | false negative rate | 

| FPR | ![fpr](man/figures/formulas/fpr.jpg) | false positive rate | predictive equality

| FDR | ![fdr](man/figures/formulas/fdr.jpg) | false discovery rate

| FOR | ![for](man/figures/formulas/for.jpg) | false omission rate |

| TS | ![ts](man/figures/formulas/ts.jpg)  | threat score |

| STP | ![stp](man/figures/formulas/stp.jpg) | statistical parity | statistical parity

| ACC | ![acc](man/figures/formulas/acc.jpg) | accuracy | Overall accuracy equality

| F1 |  ![f1](man/figures/formulas/f1.jpg) | F1 score |

*and their parity loss.*   

How is *parity loss* calculated? 

![parity_loss](man/figures/formulas/parity_loss.png)

Where `i` denotes the membership to unique subgroup from protected variable. Unprivileged subgroups are represented by small letters and privileged by simply "privileged".

some fairness metrics like *Equalized odds* are satisfied if parity loss in both *TPR* and *FPR* is low 

#### How easy it is to add custom fairness metric? 

It is relatively easy! [Check it out here](https://github.com/ModelOriented/fairmodels/blob/master/man/instructions/adding_new_metric.md) 

### Fairness in regression

R package fairmodels has support for regression models. Check fairness using `fairness_check_regression()` to approximate classification fairness metrics in regression setting. Plot object with `plot()` to visualize *fairness check* or with `plot_density()` to see model's output. 

## Related works

Zafar, Valera, Rodriguez, Gummadi (2017)  https://arxiv.org/pdf/1610.08452.pdf

Barocas, Hardt, Narayanan (2019) https://fairmlbook.org/

Steinberg, Daniel & Reid, Alistair & O'Callaghan, Simon. (2020). Fairness Measures for Regression via Probabilistic Classification. - https://arxiv.org/pdf/2001.06089.pdf