brief-content

brief content

Part 1. Interpretability basics

2 White-box models

Part 2. Interpreting model processing

3 Model-agnostic methods: Global interpretability

4 Model-agnostic methods: Local interpretability

5 Saliency mapping

Part 3. Interpreting model representations

6 Understanding layers and units

7 Understanding semantic similarity

Part 4. Fairness and bias

8 Fairness and mitigating bias

9 Path to explainable AI

Appendix A. Getting set up

Appendix B. PyTorch

@font-face { font-family: 'livebook'; src:url('https://d19npu3b8zepp3.cloudfront.net/assets/fonts/livebook.eot?1.9.0'); src:url('https://d19npu3b8zepp3.cloudfront.net/assets/fonts/livebook.eot?1.9.0') format('embedded-opentype'), url('https://d19npu3b8zepp3.cloudfront.net/assets/fonts/livebook.woff?1.9.0') format('woff'), url('https://d19npu3b8zepp3.cloudfront.net/assets/fonts/livebook.ttf?1.9.0') format('truetype'), url('https://d19npu3b8zepp3.cloudfront.net/assets/fonts/livebook.svg?1.9.0') format('svg'); font-weight: normal; font-style: normal; }