Ethics in Data Science

Exploring the social implications of data science

Author

Jack Bandy

Published

May 26, 2026

1 Introduction to Ethics in Data Science

This is a placeholder page.

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

1.1 Section 1

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed do eiusmod tempor incididunt ut labore et dolore magna aliqua.

Point 1: Lorem ipsum dolor sit amet
Point 2: Consectetur adipiscing elit
Point 3: Sed do eiusmod tempor incididunt

1.2 Section 2

Ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

1.2.1 Subsection A

Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur.

1.2.2 Subsection B

Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.

1.3 Section 3

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.

Chapters to align with from learning data science textbook: * Ethics in asking questions * Eugenics example * Ethics in obtaining data * Ethics in understanding data * Ethics in understanding the world * Ethics in reports, decisions, and solutions * Designing and testing interventions

Tentative topics list: * what ethics means in data science * does ethics ever really change? * tech debt and documentation debt * defining and handling sensitive information * risks from data triangulation (i.e. re-identification, de-anonymization) * prediction as influence * what can and cannot (should/should not) be predicted * practices in data collection/generation * incomplete data, non-consensually collected data * too much / too invasive data * ad-hoc support of suspect decision-making