Книги

Наука о данных. Базовый курс

22
18
20
22
24
26
28
30

3

Некоторые специалисты все же проводят границу между глубинным анализом данных и KDD, рассматривая первый как подраздел второго и определяя его как один из методов обнаружения знаний в базах данных.

4

https://www.cancer.gov/research/key-initiatives.

5

https://allofus.nih.gov/.

6

https://www.policedatainitiative.org/.

7

Льюис М. MoneyBall. — М.: Манн, Иванов и Фербер, 2013.

8

Дабнер С., Левитт С. Фрикономика. — М.: Альпина Паблишер, 2018.

9

https://deepmind.com/research/alphago/.

10

Хотя многие наборы данных можно описать как плоскую матрицу n × m, существуют сценарии, в которых набор данных представлен в более сложной форме: например, если набор данных описывает эволюцию нескольких атрибутов во времени, то каждый момент времени в наборе данных будет представлен двухмерной плоской матрицей n × m, перечисляющей состояние атрибутов в данный момент времени, но общий набор данных будет трехмерным, где время используется для связывания двумерных срезов момента. В таком контексте термин «тензор» иногда используется для придания идее матрицы дополнительного измерения.

11

Скрапинг (англ. scraping) — в широком смысле сбор данных с интернет-ресурсов. — Прим. пер.

12

Интерпретация высказывания Джорджа Бокса: «По сути, все модели ошибочны, но некоторые бывают полезны».