3
Некоторые специалисты все же проводят границу между глубинным анализом данных и KDD, рассматривая первый как подраздел второго и определяя его как один из методов обнаружения знаний в базах данных.
7
Льюис М. MoneyBall. — М.: Манн, Иванов и Фербер, 2013.
8
Дабнер С., Левитт С. Фрикономика. — М.: Альпина Паблишер, 2018.
10
Хотя многие наборы данных можно описать как плоскую матрицу n × m, существуют сценарии, в которых набор данных представлен в более сложной форме: например, если набор данных описывает эволюцию нескольких атрибутов во времени, то каждый момент времени в наборе данных будет представлен двухмерной плоской матрицей n × m, перечисляющей состояние атрибутов в данный момент времени, но общий набор данных будет трехмерным, где время используется для связывания двумерных срезов момента. В таком контексте термин «тензор» иногда используется для придания идее матрицы дополнительного измерения.
11
Скрапинг (англ. scraping) — в широком смысле сбор данных с интернет-ресурсов. — Прим. пер.
12
Интерпретация высказывания Джорджа Бокса: «По сути, все модели ошибочны, но некоторые бывают полезны».