ОАО "РОССИЙСКИЕ ЖЕЛЕЗНЫЕ ДОРОГИ"

УТВЕРЖДЕН
распоряжением ОАО "РЖД"
от 02.06.2009 N 1150р

 

СТО РЖД 1.05.515.4-2009

СТАНДАРТ ОАО "РЖД"

МЕТОДЫ И ИНСТРУМЕНТЫ УЛУЧШЕНИЙ. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ. ДИАГРАММА РАССЕЯНИЯ

Дата введения - 01.07.2009

1 Область применения

Настоящий стандарт устанавливает особые требования по применению инструмента "Корреляционный анализ. Диаграмма рассеяния" в железнодорожной отрасли.
Настоящий стандарт должен применяется в процессах управления качеством и безопасностью в ОАО "РЖД" как один из методов при:
- реализации процессов предупреждающего и диагностического технического обслуживания и ремонта;
- разработке планов решения проблем;
- реализации процессов закупки, производства и обслуживания;
- проведении внутренних аудитов; мониторинге и измерении процессов;
- управлении несоответствующей продукцией;
- анализе данных;
- реализации процессов постоянного улучшения;
Требования данного документа распространяются на все департаменты, дирекции и филиалы ОАО "РЖД", а также на их структурные подразделения для анализа широкого круга проблем относящихся к любой сфере деятельности.

2 Цель

2.1 Метод "Корреляционный анализ. Диаграмма рассеяния" позволяет определить вид и степень связи между парами соответствующих переменных. Эти две переменные (x и y) могут относиться:
- к характеристике качества y и к влияющему на нее фактору x;
- к двум различным характеристикам качества x и y;
- к двум факторам x и y, влияющим на одну характеристику качества z.
2.2 Действия по применению инструмента "Корреляционный анализ. Диаграмма рассеяния" идентичны, независимо от места его применения.

3 Определение понятий

3.1 В настоящем стандарте применяются термины с соответствующими определениям по ГОСТ Р 50779.10 и ГОСТ Р 50779.11, а также приведенные ниже:
Вариабельность - изменчивость, неизбежные различия среди индивидуальных результатов процесса
Диаграмма рассеяния (разброса) - графическое представление множества точек, координаты которых х и у в обычной прямоугольной системе координат - это значения признаков Х и Y.

4 Схема осуществления деятельности

4.1 Схема осуществления деятельности по применению метода "Корреляционный анализ. Диаграмма рассеяния" приведена в таблице 1.

5 Описание применяемого метода

5.1 Поэтапная процедура использования инструмента "Корреляционный анализ. Диаграмма рассеяния"
Примечание - Данная процедура позволяет построить диаграмму рассеяния без использования какого-либо программного обеспечения. Построение диаграммы рассеяния с помощью программных продуктов выходит за рамки данного стандарта.
5.1.1 Постановка проблемы. Определите, какие проблемы подлежат исследованию, определите 2 характеристики x и y, между которыми необходимо определить вид и степень зависимости
5.1.2 Регистрация данных. Разработайте контрольный листок (приложение А) для регистрации данных. Соберите парные данные (x, y) и занесите их в таблицу.
Примечание - Желательно собрать не менее 30 пар значений.
5.1.3 Построение осей
5.1.3.1 Найдите максимальное и минимальное значения и для x и для y.
5.1.3.2 Выберите шкалы на горизонтальной и вертикальной осях так, чтобы обе длины рабочих частей получились приблизительно одинаковыми.
5.1.3.3 Возьмите на каждой оси от 3 до 10 градаций и используйте для облегчения чтения круглые числа. Размах разметки осей не должен существенно превышать размах значений соответствующих переменных.
5.1.3.4 Если одна переменная - фактор, а вторая - характеристика качества, то выберите для фактора горизонтальную ось x, а для характеристики качества - вертикальную ось y.
Примечание - Нарушение правил построения осей, описанных в 5.1.3.1 - 5.1.3.4 может привести к ошибочной интерпретации информации.
5.1.4 Построение диаграммы рассеяния
5.1.4.1 Нанесите пары данных на размеченные оси.
Примечание - Если в разных наблюдениях получаются одинаковые значения, покажите эти точки, либо рисуя концентрические окружности (о), либо нанося вторую точку рядом с первой.
5.1.5 Нанесение необходимых обозначений. Нанесите на диаграмму необходимые обозначения. Убедитесь, что нижеперечисленные данные, отраженные на диаграмме, понятны:
- название диаграммы;
- интервал времени;
- число пар данных;
- названия и единицы измерения для каждой оси;
- имя (и прочее) человека, который делал эту диаграмму.
5.1.6 Анализ диаграммы рассеяния
5.1.6.1 Выясните, есть ли на диаграмме выбросы (рисунок 1а). Выясните причины появления выбросов (ошибка измерения или записи данных, изменения в условиях работы, другие особые причины) и исключите их из дальнейшего корреляционного анализа.
5.1.6.2 Определите вид зависимости диаграммы рассеяния. Возможны следующие типичные варианты скопления точек:
- сильная положительная корреляция (рисунок 1б). Ярко выраженная тенденция роста значения y с ростом значения x;
- слабая положительная корреляция (рисунок 1в). Присутствует тенденция роста значения y с ростом значения x;
- отсутствие корреляции (рисунок 1г). Между x и y не наблюдается никакой определенной зависимости;
- сильная отрицательная корреляция (рисунок 1д). Ярко выраженная тенденция уменьшения значения y с ростом значения x;
- слабая отрицательная корреляция (рисунок 1е). Присутствует тенденция уменьшения значения y с ростом значения x;
- криволинейная зависимость (рисунок 1ж). С ростом значения x величина y меняется криволинейно.
5.1.7 Вычисление коэффициента корреляции (r)
5.1.7.1 Коэффициент корреляции позволяет количественно определить силу линейной связи между x и y. Коэффициент корреляции вычисляется в соответствии со следующим определением (1):
5.1.7.2 Коэффициент корреляции (r) принимает значения из диапазона -1 <= r<= 1.

Примечания
1 если абсолютное значение r окажется больше 1, то произошла ошибка, и нужно пересчитать результат. В случае сильной положительной корреляции достигается значение, близкое к плюс 1, а при сильной отрицательной корреляции достигается значение, близкое к минус 1. Значение r близкое к 0 указывает на слабую корреляцию или ее отсутствие. Когда коэффициент корреляции равен одному из указанных пределов, это означает, что существует точная линейная зависимость в серии парных наблюдений.
2 когда между двумя переменными вычисляется коэффициент корреляции, иногда случайно проявляется сильная корреляция, которая или не подкреплена вовсе, или подкреплена слишком слабой причинно-следственной зависимостью между ними. Корреляция такого рода называется ложной корреляцией.

5.2 Степень корреляции между двумя переменными очень часто зависит от размахов этих переменных. Поэтому, не рекомендуется экстраполировать выводы анализа за пределами полученных данных без дополнительного исследования.
5.3 Следует сравнивать диаграммы рассеяния и коэффициенты корреляции, полученные в разные моменты времени. Изменения вида и степени корреляции с течением времени могут быть полезны в определении направления улучшения процесса.
5.4 Следует расслаивать (стратифицировать) диаграммы рассеяния для различных источников данных или условий при которых данные были получены (материалы, машины, операторы, условия производства, контроллеры, поставщики и т.д.) (приложение Б).

6 Принятые сокращения

6.1 В настоящем документе применяются следующие сокращения:
ДЗО - дочерние и зависимые общества;
ОАО "РЖД" - Открытое акционерное общество "Российские железные дороги";
СМК - система менеджмента качества;
СТК - стандарт по качеству;
СТО - стандарт организации.
6.2 В настоящем стандарте применяются следующие обозначения:
r - выборочный коэффициент корреляции (ГОСТ Р 50779.10).
_  _
x, y - среднее арифметическое (ГОСТ Р 50779.10).

7 Нормативные ссылки

В настоящем стандарте использованы ссылки на следующие нормативные документы:
ГОСТ Р ИСО 9000-2001 Системы менеджмента качества. Основные положения и словарь
ГОСТ Р 50779.11-2000 Статистические методы. Статистическое управление качеством. Термины и определения
ГОСТ Р 50779.10-2000 Статистические методы. Вероятность и основы статистики. Термины и определения

 

Приложение А
(обязательное)

Контрольный листок

Для принятия правильного и оптимального решения необходимо собрать наиболее полную информацию о проблеме. Кроме того, данные должны быть структурированы и удобны для дальнейшей обработки. Основным инструментом сбора информации для решения проблем являются контрольные листки.
Контрольный листок - это инструмент для сбора данных и автоматического их упорядочения для облегчения дальнейшего использования собранной информации.
Контрольные листки бывают разные: одни, например, используются для контроля контактов с посетителями, другие применяются для учета брака какой-либо детали или устройства на производстве. Они сильно отличаются друг от друга и разрабатываются специально для записи информации определенного типа.
Когда цель сбора данных установлена, она становится основой для определения характера сравнения, которое надлежит произвести, и типа данных, которые нужно собрать. При этом следует учесть следующие моменты:
необходимо определиться с временным периодом сбора информации, то есть выбрать, какой срок будет показательным для данных, которые мы собираем;
разделить группу данных на подгруппы по определенному признаку;
необходимо зафиксировать источник данных (день недели, когда собирались данные; оборудование, на котором производилась работа; рабочий, производивший операцию; партия использованных материалов и т.д.);
данные необходимо регистрировать таким образом, чтобы их было легко фиксировать и использовать в дальнейшей обработке.

Таблица А.1 - Контрольный листок для построения инструмента "Диаграмма рассеяния"

Примеры контрольных листков

 

Сертификат на тормозные колодки (Данные для анализа твердости колодки)
Контрольные листки для проведения контроля  качества  и  сбора сведений для проведения статистического анализа

 

Приложение Б
(рекомендуемое)

Стратификация данных

Стратификация - разделение полученных данных на отдельные группы (слои, страты) в зависимости от выбранного стратифицирующего фактора.
В качестве стратифицирующего фактора могут быть выбраны любые параметры, определяющие особенности условий возникновения и получения данных:
- различное оборудование;
- операторы, производственные бригады, участки, цехи, предприятия и т.п.;
- время сбора данных;
- разные виды сырья и материалов;
- различие используемого оборудования, оснастки, инструмента, измерительных систем и т.д.
При отсутствии учета стратифицирующего фактора (расслоения данных) происходит их объединение и обезличивание, затрудняющее установление действительной взаимосвязи между полученными данными и особенностями их возникновения.
Например, при анализе источника несоответствующей продукции, поставляемой предприятию несколькими сторонними поставщиками, целесообразно в качестве стратифицирующего фактора выбрать поставщиков и произвести стратификацию несоответствующей продукции по поставщикам.
Применение стратификации данных
При практическом использовании метода стратификации рекомендуется действовать следующим образом:
1) выберите данные, представляющие интерес для изучения;
2) выберите стратифицирующий фактор и категории (группы), на которые будут разделятся данные;
3) произведите группировку данных на основании выбранных категорий;
4) оцените результаты группировки по каждой из категорий;
5) соответствующим образом представьте полученные результаты;
6) проанализируйте необходимость дополнительного изучения данных;
7) спланируйте последующую работу для дополнительного подтверждения полученных результатов.
На рисунке Б.1 приведены примеры стратификации данных на диаграмме рассеяния. Так, на рисунке Б.1а корреляция между двумя переменными отсутствует. Однако после расслоения данных для двух различных материалов, обнаруживается корреляция между параметрами для каждого материала в отдельности (рисунок Б.1б). Обратная ситуация наблюдается на рисунках Б.1в-г: положительная корреляция между двумя параметрами, исчезает после стратификации данных по двум сменам.

 

Приложение В
(рекомендуемое)

Примеры диаграмм рассеяния

 

 

Приложение Г
(рекомендуемое)

Библиография

[1] Функциональный проект начальника службы электрификации и электроснабжения Куйбышевской железной дороги И.А.Крестовникова.
[2] Функциональный проект начальника Комсомольского отделения Дальневосточной железной дороги Н.А.Дмитрука.