Книги

Наука о данных. Базовый курс

22
18
20
22
24
26
28
30

Тип модели прогнозирования, которая кодирует правила условного оператора (если — тогда — иначе) в древовидной структуре. Каждый узел дерева определяет один атрибут для тестирования, и объект должен пройти путь от корневого узла до конечного, чтобы метка конечного узла в дальнейшем могла быть предсказана для этого объекта.

Интернет вещей (Internet of Things, IoT)

Межсетевой обмен информацией между физическими устройствами и датчиками. Включает в себя область разработки «машина — машина» (м2 м) по созданию систем, которые не только позволяют машинам обмениваться информацией, но и реагировать на нее, инициируя действия без участия человека.

Классификация (Classification)

Задача прогнозирования значения целевого атрибута объекта на основе набора значений входных атрибутов, где целевой атрибут отражает номинальный или порядковый тип данных.

Кластеризация (Clustering)

Выявление групп схожих объектов в наборе данных.

Обучение с учителем (Supervised Learning)

Форма машинного обучения, целью которой является изучение функции, отображаемой набором значений входных атрибутов объекта для вычисления отсутствующего значения целевого атрибута того же объекта.

Корреляция (Correlation)

Описывает силу, связывающую атрибуты.

Линейная регрессия (Linear Regression)

Когда в регрессионном анализе предполагается линейная зависимость, анализ называется линейной регрессией. Этот термин часто используется для описания моделей прогнозирования машинного обучения, которые применяют этот вид анализа для вычисления значения числового целевого атрибута.

Машинное обучение (Machine Learning)

Область компьютерных исследований, которая фокусируется на разработке и оценке алгоритмов, способных выявлять полезные закономерности в наборах данных. Алгоритм машинного обучения принимает на вход набор данных и возвращает модель, которая кодирует закономерности, выявленные алгоритмом.

Машинное обучение в базе данных (In-Database Machine Learning)

Использование алгоритмов машинного обучения, встроенных в решение для базы данных. Преимущество машинного обучения в базе данных состоит в том, что оно сокращает время, затрачиваемое на перемещение данных для анализа.

Метаданные (Metadata)

Данные, описывающие структуры и свойства других данных, например, временна́я метка, которая содержит информацию о том, когда фрагмент данных был собран. Метаданные являются одним из наиболее распространенных типов данных о выбросах.

Набор данных (Dataset)