Создание прогнозов для моделей Call Center (учебник по интеллектуальному анализу данных — средний уровень)

Когда выявлены некоторые взаимосвязи между сменами, числом операторов, звонками и качеством обслуживания, можно создавать прогнозирующие запросы, которые будут использоваться в бизнес-аналитике и планировании. Вначале будут созданы прогнозы на исследовательской модели, чтобы проверить некоторые предположения. Затем с помощью модели логистической регрессии будут созданы массовые прогнозы.

На этом занятии предполагается, что пользователь уже знаком с построителем прогнозирующих запросов. Общие сведения об использовании построителя прогнозирующих запросов см. в разделе Создание прогнозирующих запросов расширений интеллектуального анализа данных.

Создание прогнозов с помощью модели нейронной сети

В следующем примере показано, как создать одноэлементный прогноз с помощью модели нейронной сети, созданной для исследования. Одноэлементные прогнозы служат хорошим способом проверить различные значения, чтобы оценить их воздействие на модель. В этом сценарии будет прогнозироваться уровень обслуживания для полуночной смены (без указания дня недели), если на дежурстве находятся шесть опытных операторов.

Создание одноэлементного запроса с помощью модели нейронной сети

В среде Business Intelligence Development Studio откройте решение, которое содержит нужную модель.
В конструкторе интеллектуального анализа данных перейдите на вкладку Прогноз модели интеллектуального анализа данных.
На панели Модель интеллектуального анализа данных нажмите кнопку Выбрать модель.
В диалоговом окне Выбор модели интеллектуального анализа данных представлен список структур интеллектуального анализа данных. Разверните структуру интеллектуального анализа данных, чтобы просмотреть список моделей интеллектуального анализа данных, связанных с этой структурой.
Разверните структуру интеллектуального анализа данных Call Center Default и выберите модель нейронной сети — Call Center-LR.
В меню Модель интеллектуального анализа данных выберите пункт Одноэлементный запрос.

Откроется диалоговое окно Ввод одноэлементного запроса, в котором столбцы сопоставлены со столбцами в модели интеллектуального анализа данных.
В диалоговом окне Ввод одноэлементного запроса щелкните строку для атрибута Shift и выберите значение midnight.
Щелкните строку для атрибута Lvl 2 Operators и введите значение 6.
В нижней половине вкладки Прогноз модели интеллектуального анализа данных щелкните первую строку в сетке.
В столбце Источник щелкните стрелку вниз и выберите Прогнозирующая функция. В столбце Поле выберите PredictHistogram.

В поле Критерий или аргументы автоматически появится список аргументов, которые можно использовать с этой прогнозирующей функцией.
Перетащите столбец ServiceGrade из списка столбцов на панель Модель интеллектуального анализа данных в поле Критерий или аргументы.

Имя столбца автоматически вставляется в качестве аргумента. В это текстовое поле можно перетащить любой прогнозируемый атрибут.
Нажмите кнопку Переключиться в представление результатов запроса в верхнем углу построителя прогнозирующих запросов.

Ожидаемые результаты содержат возможные прогнозируемые значения для каждого уровня обслуживания при заданных входных данных, а также значения несущего множества и вероятности для каждого прогноза. В любой момент можно вернуться в режим конструктора, чтобы изменить входные данные или добавить дополнительные входные данные.

Создание прогнозов с помощью модели логистической регрессии

Прогнозы можно создавать с помощью модели нейронной сети, однако она чаще используется для исследования сложных связей. Если уже известны атрибуты, относящиеся к бизнес-задаче, можно использовать модель логистической регрессии для прогнозирования эффекта изменения определенных независимых переменных. Логистическая регрессия является статистическим методом, использующимся для основных прогнозов значений независимых переменных. Например, используется в сценариях финансовой оценки, чтобы прогнозировать поведение покупателей на основании их демографических данных.

В этой задаче будет показано, как создать источник данных, который будет использоваться для прогнозов, а затем как создавать прогнозы для ответов на несколько бизнес-вопросов.

Создание данных, используемых для массового прогноза

На этом занятии сначала создается агрегированное представление исходных данных, с помощью которого можно создавать массовые прогнозы, а затем эти данные добавляются в модель интеллектуального анализа данных из прогнозирующего запроса. Существует много способов предоставить входные данные (например, можно импортировать кадровые показатели из электронной таблицы или предоставить значения программно). Сейчас, чтобы создать именованный запрос, будет использоваться конструктор представлений источников данных. Этот именованный запрос является нестандартной инструкцией T-SQL, которая создает статистические выражения для каждой смены, например максимальное число операторов, минимальное количество принятых звонков или среднее количество созданных проблем.

Создание входных данных для массового прогнозирующего запроса

В обозревателе решений щелкните правой кнопкой мыши элемент Представления источников данных и выберите команду Создать представление источника данных.
В мастере представлений источников данных выберите в качестве источника данных базу Adventure Works DW2008R2 и нажмите кнопку Далее.
На странице Выбор таблиц и представлений нажмите кнопку Далее, не выбирая таблиц.
На странице Завершение работы мастера введите имя Shifts.

Это имя будет выводиться в обозревателе решений в качестве имени для представления источника данных.
Щелкните правой кнопкой мыши пустую область конструктора и выберите команду Создать именованный запрос.
В диалоговом окне Создание именованного запроса в поле «Имя» введите Shifts for Call Center.

Это имя будет выводиться в качестве имени для именованного запроса только в конструкторе представлений источников данных.

Вставьте следующую инструкцию запроса в текстовую панель SQL в нижней половине диалогового окна.

SELECT DISTINCT WageType, Shift, 
AVG(Orders) as AvgOrders, MIN(Orders) as MinOrders, MAX(Orders) as MaxOrders,
AVG(Calls) as AvgCalls, MIN(Calls) as MinCalls, MAX(Calls) as MaxCalls,
AVG(LevelTwoOperators) as AvgOperators, MIN(LevelTwoOperators) as MinOperators, MAX(LevelTwoOperators) as MaxOperators,
AVG(Issues) as AvgIssues, MIN(Issues) as MinIssues, MAX(Issues) as MaxIssues
FROM dbo.FactCallCenter
GROUP BY Shift, WageType

Нажмите кнопку ОК..
На панели конструктора щелкните правой кнопкой мыши таблицу «Shifts for Call Center» и выберите команду Просмотреть данные, чтобы просмотреть данные, возвращаемые запросом T-SQL.
Щелкните правой кнопкой мыши вкладку Shifts.dsv (конструктор), а затем нажмите кнопку Сохранить, чтобы сохранить новое определение представления источника данных.

Прогнозирование метрик обслуживания для каждой смены

После создания нескольких значений для каждой смены, эти значения будут использоваться в качестве входных данных построенной модели логистической регрессии для создания нескольких прогнозов.

Использование нового представления источника данных в качестве входных данных для прогнозирующего запроса

В конструкторе интеллектуального анализа данных перейдите на вкладку Прогноз модели интеллектуального анализа данных.
На панели Модель интеллектуального анализа данных нажмите кнопку Выбрать модель и выберите «Call Center-LR» из списка доступных моделей.
В меню Модель интеллектуального анализа данных снимите флажок Одноэлементный запрос. Появится предупреждение о том, что входные данные одноэлементного запроса будут утеряны. Нажмите кнопку ОК.

Вместо диалогового окна Ввод одноэлементного запроса откроется окно Выбор входных таблиц.
Щелкните Выбор таблицы вариантов.
В диалоговом окне Выбор таблицы выберите Shifts из списка источников данных. В списке Имя таблицы или представления выберите «Shifts for Call Center» (возможно, это имя будет выбрано автоматически) и нажмите кнопку ОК.

Область конструктора Прогноз модели интеллектуального анализа данных обновится, чтобы показать сопоставления, созданные службами Analysis Services на основании имен и типов данных столбцов во входных данных и модели.
Щелкните правой кнопкой мыши одну из линий соединения и выберите команду Изменить соединения.

В этом диалоговом окне можно точно определить, какие столбцы сопоставлены, а какие — нет. Модель интеллектуального анализа данных содержит столбцы Calls, Orders, Issues и LvlTwoOperators, которые можно сопоставить с любым статистическим выражением, созданным на основе этих столбцов в исходных данных. В этом сценарии сопоставление будет выполняться со средними значениями.
Щелкните пустую ячейку рядом с LevelTwoOperators и выберите Shifts for Call Center.AvgOperators.
Щелкните пустую ячейку рядом с Calls и выберите Shifts for Call Center.AvgCalls, затем нажмите кнопку ОК.

Создание прогнозов для каждой смены

В сетке в нижней половине окна Построитель прогнозирующих запросов щелкните пустую ячейку под значением Источник и выберите «Shifts for Call Center».
В пустой ячейке под значением Поле выберите Shift.
Щелкните следующую пустую линию в сетке и повторите описанную выше процедуру, чтобы добавить другую строку для WageType.
Щелкните следующую пустую строку в сетке. В столбце Источник выберите пункт Прогнозирующая функция. В столбце Поле выберите Predict.
Перетащите столбец ServiceGrade с панели Модель интеллектуального анализа данных в сетку, в ячейку Критерий или аргумент. В поле Псевдоним введите Прогнозируемый уровень обслуживания.
Щелкните следующую пустую строку в сетке. В столбце Источник выберите пункт Прогнозирующая функция. В столбце Поле выберите PredictProbability.
Перетащите столбец ServiceGrade с панели Модель интеллектуального анализа данных в сетку, в ячейку Критерий или аргумент. В поле Псевдоним введите Вероятность.
Выберите команду Переключиться в режим просмотра результата запроса, чтобы просмотреть прогнозы.

В следующей таблице показан образец результатов для каждой смены.

Shift	WageType	Прогнозируемый уровень обслуживания	Вероятность
AM	holyday	0.165	0.377520666
midnight	holyday	0.105	0.364105573
PM1	holyday	0.165	0.40056055
PM2	holyday	0.165	0.338532973
AM	weekday	0.165	0.370847617
midnight	weekday	0.08	0.352999173
PM1	weekday	0.165	0.317419177
PM2	weekday	0.105	0.311672027

Прогнозирование влияния времени звонка на уровень обслуживания

Для каждой смены был создан набор значений, которые использовались в качестве входных данных для модели логистической регрессии. Но учитывая то, что бизнес-задачей является поддержание показателя прекращенных вызовов в диапазоне 0,00–0,05, результаты не впечатляют.

Поэтому на основе исходной модели, которая продемонстрировала сильное влияние времени ответа на уровень обслуживания, команда операторов принимает решение выполнить несколько прогнозов, чтобы оценить, может ли уменьшение среднего времени ответа на звонки повысить качество обслуживания. Например, что произойдет, если снизить время ответа на звонок до 90 процентов или даже до 80 процентов от текущего значения?

Можно легко создать представление источника данных, которое будет вычислять среднее время ответа для каждой смены. Также можно легко добавить столбцы, содержащие целевые показатели времени ответа. Затем представление источника данных можно использовать в качестве входных данных для модели.

В следующей таблице показаны результаты прогнозирующего запроса, в качестве входных данных которого используются три различных значения времени ответа. Запрос также возвращает вероятность прогнозируемого значения, что позволяет оценить, с какой вероятностью сокращение времени ответа повлияет на уровень обслуживания.

В следующей таблице первый набор чисел представляет прогнозируемый уровень обслуживания, а второй набор чисел (в скобках) представляет вероятность этого прогнозируемого значения. По этим результатам можно заключить, что имеет смысл попытаться сократить время ответа до 90 процентов от исходного.

Shift	WageType	Среднее время ответа для смены	Время ответа сократилось на 90 процентов	Время ответа снизилось на 80 процентов
AM	holyday	0.165 (0.366079388)	0.05 (0.457470875)	0.05 (0.610514425)
AM	weekday	0.05 (0.341218694)	0.05 (0.475767776)	0.05 (0.60083244)
midnight	holiday	0.165 (0.337801273)	0.05 (0.413774655)	0.05 (0.545764101)
midnight	weekday	0.05 (0.378241537)	0.05 (0.471615415)	0.05 (0.545614362)
PM1	holiday	0.165 (0.457871243)	0.165 (0.376892925)	0.05 (0.359440286)
PM1	weekday	0.08 (0.299182047)	0.08 (0.363761441)	0.08 (0.40686473)
PM2	holiday	0.105 (0.325921785)	0.05 (0.392121793)	0.05 (0.521558758)
PM2	weekday	0.105 (0.436051591)	0.105 (0.342589832)	0.05 (Y)

Помимо передачи входных значений через представление источника данных, как показано здесь, можно вычислять входные данные программно и передавать их в модель. Проходя по всем возможным значениям, можно найти наименьшую величину, на которую нужно снизить время ответа, чтобы гарантированно достичь целевого уровня обслуживания для каждой смены.

На основе этой модели можно создать множество других прогнозирующих запросов. Например, можно спрогнозировать количество операторов, требуемое для достижения определенного уровня обслуживания или для ответа на заданное число входящих звонков. Поскольку в модель логистической регрессии можно включить несколько выходных значений, можно легко экспериментировать с различными независимыми переменными и результатами без необходимости создавать множество отдельных моделей.

Примечания

В надстройках интеллектуального анализа данных для Excel 2007 имеются мастера логистической регрессии, которые помогают получить ответы на сложные вопросы, например определение числа операторов второго уровня, требуемого для повышения показателя обслуживания до заданного уровня для определенной смены. Надстройки интеллектуального анализа данных загружаются бесплатно и содержат мастера, которые основаны на алгоритмах нейронной сети и логистической регрессии. Дополнительные сведения см. в следующих разделах.

Надстройки интеллектуального анализа данных SQL Server 2005 для Office 2007: Анализ сценария поиска решения и анализ гипотетических вариантов
Надстройки интеллектуального анализа данных SQL Server 2008 для Office 2007: Анализ сценария поиска решения, анализ гипотетических вариантов и калькулятор прогнозов

Заключение

Рассмотрены создание, настройка и интерпретация моделей интеллектуального анализа данных, основанных на алгоритме нейронной сети (Майкрософт) и алгоритме логистической регрессии (Майкрософт). Эти типы моделей являются сложными и дают практически безграничное разнообразие возможностей анализа, поэтому могут оказаться трудны в освоении. Различные средства, такие как диаграммы на основе Excel и сводные таблицы, имеющиеся в конструкторе представлений источников данных, могут обеспечить поддержку для самых выраженных трендов, обнаруженных алгоритмами, и помогут понять смысл обнаруженных трендов. Однако, чтобы полностью задействовать возможности модели, может понадобиться просмотреть аналитические данные, предоставляемые моделью, тщательно и глубоко изучить данные, неоднократно переключаясь между пользовательским средством просмотра модели интеллектуального анализа данных и другими средствами. Это позволит сформировать полное представление о тенденциях в данных.