ОТКРЫТОЕ АКЦИОНЕРНОЕ ОБЩЕСТВО
"РОССИЙСКИЕ ЖЕЛЕЗНЫЕ ДОРОГИ"
(ОАО "РЖД")

 

УТВЕРЖДЕН
распоряжением ОАО "РЖД"
от 02.06.2009 N 1150р

 

СТО РЖД 1.05.515.5-2009

СТАНДАРТ ОАО "РЖД"

Методы и инструменты улучшений.
Исследование разброса параметра. Гистограммы

 

Дата введения - 01.07.2009

1 Область применения

Настоящий стандарт устанавливает особые требования по применению и построению инструмента "Исследование разброса параметра. Гистограммы" в железнодорожной отрасли.
Настоящий стандарт должен применяется в процессах управления качеством и безопасностью движения в ОАО "РЖД" как один из методов при:
- анализе функционирования процессов и соответствия продукции
- анализе статуса предупреждающих и корректирующих действий
- анализе требований, относящихся к продукции
- проектировании и разработке продукции
- осуществлении процессов закупки, производства и обслуживания
- проведении внутренних аудитов; мониторинге и измерении процессов
- управлении несоответствующей продукцией
- анализе данных
- осуществлении процессов постоянного улучшения
Требования данного документа распространяются на все департаменты, дирекции и филиалы ОАО "РЖД", а так же на их структурные подразделения для анализа широкого круга проблем относящихся к любой сфере деятельности.

2 Цель

2.1 Метод "Исследование разброса параметра. Гистограмма" предназначен для графического представления численных данных с целью получения наглядной информации о следующих характеристиках данных:
- центр (среднее, медиана, мода);
- размах (дисперсия, среднеквадратичное отклонение);
- ассиметрия распределения;
- наличие выбросов;
- наличие многомодальности;
- расположение данных относительно границ допуска
2.2 Действия по применению инструмента "Гистограмма" идентичны, не зависимо от места его применения.
2.3 Информация о характеристиках данных должна быть использована для:
- определения модели распределения данных;
- оценки параметров распределения данных;
- принятия решения о том, где сосредоточить усилия по улучшению процессов.
2.4 Данный стандарт описывает процесс построения метода "Гистограмма" для одного набора данных по исследуемому параметру, называемому "выборка". Для эффективного исследования процесса, характеризуемого параметром, инструмент следует применять регулярно и планомерно.

3 Определение понятий

3.1 В настоящем стандарте применяются понятия с соответствующими определениями по ГОСТ Р ИСО 9000, ГОСТ Р 50779.10 и ГОСТ Р 50779.11, а также приведенные ниже:
Вариабельность - изменчивость, неизбежные различия среди индивидуальных результатов процесса.
Гистограмма - графическое представление распределения частот для количественного признака, образуемое соприкасающимися прямоугольниками, основаниями которых служат интервалы классов, а площади пропорциональны частотам этих классов.
Многомодальность - наличие более чем одной моды у распределения данных.
Стратификация (расслаивание) - разделение данных на группы (страты, слои)
Среднее арифметическое - сумма значений, деленная на их число
Точность средства измерения - характеристика качества средства измерения, отражающая близость его погрешности к нулю.
Цена деления шкалы - разность значения величины, соответствующих двум соседним отметкам шкалы средства измерения.

4 Схема осуществления деятельности

4.1 Схема осуществления деятельности по применению метода "Исследование разброса параметра. Гистограмма" приведена в таблице 1.

5 Описание применяемого метода

5.1 Постановка проблемы. Определите, какие проблемы подлежат исследованию, как и какие данные необходимо собирать.
5.2 Регистрация данных. Разработайте контрольный листок для регистрации данных (см. приложение А).

5.3 Заполнение бланка регистрации частот
5.3.1 Разработайте контрольный листок для регистрации частот (см. приложение A, таблица А.1). Информация в бланке в первую очередь должна содержать:
- номер и наименование измеряемого объекта;
- измеряемый параметр;
- границы допуска;
- технологический процесс;
- измерительный инструмент;
- единицы измерения;
5.3.2 Заполните бланк регистрации частот
5.3.3 Вычисление выборочного размаха. Определите наибольшее и наименьшее выборочное значение и вычислите размах (R):
R=(наибольшее значение) - (наименьшее значение)
5.3.4 Определите количество интервалов гистограммы согласно таблице 2.

Таблица 2 - Определение количества интервалов для построения гистограммы


Объем выборки (N)

Количество интервалов (n)

20 - 30         
31 - 42         

5                       
6                       

43 - 56         
57 - 72         

7                       
8                       

73 - 90         
91 - 110        

9                       
10                      

111 - 132       

11                      

133 - 156       

12                      

111 - 182       

13                      

183 - 210       

14                      

211 - 240       

15                      

241 - 272       

16                      

273 - 306       

17                      

307 - 342       

18                      

343 - 380       

19                      

381 и более     

20                       

Примечание - Таблица 2 для определения числа интервалов n составлена на основе формулы:
___
n = \/ N  ,

где
N - общее количество собранных данных в выборке.

5.3.5 Определение ширины интервалов. Вычислите ширину интервала (h) как отношение размаха к количеству интервалов (n).
h = R/n.
Далее округлите ширину интервала h до удобного значения.
Примечание - Желательно, чтобы размер интервала был не менее двух цен деления шкалы измерительного прибора.
5.3.6 Определение границ интервалов
- определите нижнюю границу первого интервала так, чтобы она была меньше минимального значения выборки. Рекомендуется выбирать нижнюю границу интервала с точностью в половину точности средства измерения;
Пример - Если данные в выборке измеряются с точностью до двух знаков после запятой и наименьшее значение в выборке имеет значение 2,01, то нижнюю границу рекомендуется установить на значении 2,005.
- прибавьте к нижней границе ширину интервала и определите границу между первым и вторым интервалами;
- продолжайте прибавлять ширину интервала к предыдущему значению для получения второй границы, затем третьей и т.д.;
- удостоверьтесь, что верхняя граница последнего интервала больше максимального значения выборки. В противном случае увеличьте ширину интервала (h).
5.3.7 Вычисление середины класса. Вычислите значения центра интервалов как среднее арифметическое от значений нижней и верхней границ и занесите в контрольный листок для регистрации частот (приложение А, таблица А.1, столбец "Значения середины интервалов").
5.3.8 Получение частот. Распределите каждое наблюдаемое значение в соответствующий интервал. Минимальное и максимальное значение соответствующего интервала занесите в контрольный листок (приложение А, Таблица А.1, столбец "Интервал"). Рассчитайте среднее арифметическое значение каждого интервала (приложение А, Таблица А.1, столбец "Значение середины интервалов") и подсчитайте частоту (количество) попадания значений в каждый из интервалов, занося их в контрольный листок для регистрации частот, используя наклонные черточки, сгруппированные по пять (приложение А, Таблица А.1, столбец "Подсчет частот"). Затем занесите общее количество значений, попавших в каждый интервал, просуммировав черточки (приложение А, таблица А.1, столбец "Частота"). В последнем столбце записывайте накапливаемые суммы частот (приложение А, Таблица А.1, столбец "Накопленные суммы").

5.4 Построение осей
5.4.1 Постройте горизонтальную ось и выберите масштаб на этой оси.
Примечание - При выборе масштаба нужно ориентироваться на единицы измерения данных, а не на интервалы классов. Данный выбор масштаба позволяет сравнивать множества гистограмм, описывающих похожие факторы и характеристики, а так же для сравнения гистограмм с допусками.
5.4.2 Разметьте левую вертикальную ось масштабом частот.
5.4.3 Нанесите на горизонтальную ось границы классов.
5.5 Построение гистограммы. Пользуясь интервалом класса как основанием, постройте прямоугольник, высота которого соответствует частоте этого класса.
5.6 Нанесение линии среднего. Нанесите на график линию, представляющую среднее арифметическое исследуемой выборки.
5.7 Нанесение линий ограничения параметра. Нанесите линии, устанавливающие ограничения на значение параметра, например границы допуска, контрольные границы, целевые значения, и т.д.
5.8 Анализ гистограммы. Проанализируйте гистограмму согласно разделу 6 данного стандарта.

6 Анализ гистограммы

Анализ гистограммы позволяет сделать заключения о состоянии процесса, характеризуемого параметром, путем исследования формы гистограммы и ее положения относительно значений, устанавливающих ограничения на параметр.

6.1 Анализ формы гистограммы
6.1.1 Обычный тип (нормальное распределение) (рисунок 1а). Среднее значение гистограммы приходится на середину размаха данных. Наивысшая точка оказывается в середине и постепенно снижается к обоим концам. Форма симметрична.
Примечание - Данная форма гистограммы встречается чаще всего (приложение Г).
6.1.2 Гребенка (мультимодальный тип) (рисунок 1б). Классы через один или два имеют более низкие частоты.
Примечание - Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или когда действует определенное правило округления данных.
6.1.3 Положительно скошенное распределение (отрицательно скошенное распределение) (рисунок 1в). Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма ассиметрична.
Примечание - Данная форма встречается, когда нижняя (верхняя) граница регулируется либо теоретически, либо по значению допуска или когда левое (правое) значение недостижимо.
6.1.4 Распределение с обрывом слева (распределение с обрывом справа) (рисунок 1г). Среднее значение гистограммы локализуется далеко слева (справа) от центра размаха. Частоты резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма ассиметрична.
Примечание - Данная форма может встречаться в ситуации 100 %-го контроля изделий из-за плохой воспроизводимости процесса, а так же когда проявляется резко выраженная положительная (отрицательная) скошенность.
6.1.5 Плато (равномерное и прямоугольное распределение) (рисунок 1д). Частоты в разных интервалах образуют плато, поскольку все интервалы имеют более или менее одинаковые ожидаемые частоты с конечными классами.
Примечание - Данная форма встречается в смеси нескольких распределений, имеющих различные средние.
6.1.6 Двухпиковый тип (бимодальный тип) (рисунок 1е). В окрестностях центра диапазона данных частота низкая, зато есть по пику с каждой стороны.
Примечание - Данная форма встречается, когда смешиваются два распределения с далеко отстоящими средними значениями. Рекомендуется применять метод стратификации (приложение Б).
6.1.7 Распределение с изолированным пиком (рисунок 1ж). Наряду с распределением обычного типа появляется маленький изолированный пик.
Примечание - Данная форма появляется при наличии малых включений данных из другого распределения, например, в случае нарушения управляемости процесса, появления ошибки измерения или просто включения данных из другого процесса. Рекомендуется применять метод стратификации (приложение Б).

6.2 Анализ гистограммы относительно значений ограничения параметра
Если имеются ограничения на значение параметра (например, границы допуска, контрольные границы, целевые значения), то нанесите на гистограмму линии его границ для сравнения распределения с этими границами. Анализ формы гистограммы и ее расположения по отношению к ограничениям позволяет делать заключения о состоянии показателя, характеризующего процесс. На рисунке 2 показаны возможные варианты расположения гистограммы по отношению к ограничениям значений параметра на примере границ допуска.
6.2.1 На рисунке 2а гистограмма полностью расположена в пределах поля допуска. В данной ситуации процесс не нуждается в корректировке.
6.2.2 На рисунке 2б гистограмма сдвинута вправо. В этом случае необходимо проверить, не вносят ли систематическую ошибку используемые средства измерения. Если средства измерения находятся в удовлетворительном состоянии, следует отрегулировать процесс так, чтобы процесс был настроен на центр поля допуска.
6.2.3 На рисунке 2в центр гистограммы совпадает с центром поля допуска, но ширина гистограммы, характеризующая реальный разброс значений исследуемого показателя, совпадает с шириной поля допуска. В данном случае имеется опасение, что со стороны верхней и нижней границы допуска могут появиться несоответствия. Следовательно, чтобы уменьшить изменчивость параметра, необходимо исследовать процесс с точки зрения точности оборудования, условий работы, технологической оснастки и т.д.
6.2.4 На рисунке 2г центр гистограммы смещен, причем выход интервалов гистограммы за верхнюю границу допуска свидетельствует о наличии несоответствий. В данном случае, необходимо отрегулировать процесс так, чтобы процесс был настроен на центр поля допуска.
6.2.5 На рисунке 2д центр гистограммы совпадает с центром поля допуска, но так как ширина гистограммы превышает ширину поля допуска, то обнаруживаются несоответствия, о чем свидетельствует выход гистограммы за обе границы поля допуска. В этом случае целесообразно реализовать меры, перечисленные в 6.2.3.
6.2.6 На рисунке 2е главные характеристики гистограммы (ширина и центр) соответствуют полю допуска, однако значительная часть наблюдений выходит за верхнюю границу допуска, образуя выброс. В данной ситуации необходимо принять меры для выяснения обстоятельств, объясняющих причину появления выбросов. Рекомендуется использовать метод стратификации (приложение Б).
6.2.7 На рисунке 2ж центр гистограммы смещен к нижней границе допуска и левая сторона гистограммы около нижней границы допуска имеет резкий обрыв. В данном случае можно сделать заключение, что значения показателя были предварительно рассортированы из-за наличия несоответствий в левой стороне гистограммы (т.е. выходящих за нижнюю границу допуска). Следовательно, необходимо выявить причину, которая могла повлечь за собой данное явление.
6.2.8 На рисунке 2и показан случай, близкий к варианту "ж". Возможно, что используемое измерительное средство было неисправно. В связи с этим необходимо обратить внимание на калибровку измерительного средства и правила выполнения измерений.
6.3 Следует сравнивать гистограммы, полученные в разные моменты времени. Изменение вида и характеристик гистограммы с течением времени могут быть полезны в определении направления улучшения процесса.
6.4 Следует расслаивать (стратифицировать) гистограммы для различных источников данных или условий, при которых данные были получены (например, материалы, машины, операторы, условия производства, контролеры, поставщики и т.д.) (приложение Б).

7 Принятые сокращения

7.1 В настоящем документе применяются следующие сокращения:
ВГД - верхняя граница допуска;
ДЗО - дочерние и зависимые общества;
НГД - нижняя граница допуска;
ОАО "РЖД" - Открытое акционерное общество "Российские железные дороги";
СМК - система менеджмента качества;
СТК - стандарт по качеству;
СТО - стандарт организации.
7.2 В настоящем стандарте применяются следующие обозначения:
h - ширина интервала гистограммы.
N - количество выборочных значений для построения гистограммы.
n - число интервалов для построения гистограммы.
R - размах выборочных значений. Разность между наибольшим и наименьшим значением выборки.

8 Нормативные ссылки

В настоящем стандарте использованы ссылки на следующие нормативные документы:
ГОСТ Р ИСО 9000-2001 Системы менеджмента качества. Основные положения и словарь
ГОСТ Р 50779.11-2000 Статистические методы. Статистическое управление качеством. Термины и определения
ГОСТ Р 50779.10-2000 Статистические методы. Вероятность и основы статистики. Термины и определения

 

Приложение А
(обязательное)

Контрольный листок

Для принятия правильного и оптимального решения необходимо собрать наиболее полную информацию о проблеме. Кроме того, данные должны быть четко структурированы и удобны для дальнейшей обработки. Основным инструментом сбора информации для решения проблем являются контрольные листки.
Контрольный листок - это инструмент для сбора данных и автоматического их упорядочения для облегчения дальнейшего использования собранной информации.
Контрольные листки бывают разные: одни используются для контроля контактов с посетителями, другие применяются для учета брака какой-либо детали или устройства на производстве. Они сильно отличаются друг от друга и разрабатываются специально для записи информации определенного типа.
Руководством к решениям проблем служат данные, из которых можно узнать о фактах и принять соответствующие меры. Прежде чем начать собирать информацию, надо решить, что с ней впоследствии делать. Любые собираемые данные имеют свое назначение, и после того как информация собрана, нужно начать с нею работать.
Когда цель сбора данных установлена, она становится основой для определения характера сравнения, которые надлежит произвести, и типа данных, которые нужно собрать.
При этом следует учесть следующие моменты:
- необходимо определиться с временным периодом сбора информации, то есть выбрать, какой срок будет показательным для собираемых данных;
- разделить группу данных на подгруппы по определенному признаку;
- необходимо четко зафиксировать источник данных (день недели, когда собирались данные; оборудование, на котором производилась работа; рабочий, делавший операцию; партия использованных материалов и т.д.);
- данные необходимо регистрировать таким образом, чтобы их было легко фиксировать и использовать в дальнейшей обработке.

Таблица А.1 - Контрольный листок для регистрации частот


Контрольный листок для регистрации частоты                         

Форма N:    

Измеряемый    
параметр:     

Инструмент  
измерения:  

Дата:    

N и        
наименование
изделия    

N___________

Норматив: Ед.
измерения:  

Технологический
процесс:      

Объем партии:

Кол-во   
измеряемых
образцов:

Контролер  

 

Интервалы   

Значения      
середины      
интервалов    

Подсчет     
частот      

Частота  

Накопленная
частота    

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Приложение Б
(рекомендуемое)

Стратификация данных

Стратификация (расслоение) - разделение полученных данных на отдельные группы (слои, страты) в зависимости от выбранного стратифицирующего фактора.
В качестве стратифицирующего фактора могут быть выбраны любые параметры, определяющие особенности условий возникновения и получения данных:
- различное оборудование;
- операторы, производственные бригады, участки, цехи, предприятия и т.п.;
- время сбора данных;
- разные виды сырья;
- различие используемых станков, средств измерения и т.д.
При отсутствии учета стратифицирующего фактора (расслоения данных) происходит их объединение и обезличивание, затрудняющее установление действительной взаимосвязи между полученными данными и особенностями их возникновения.
Например, при анализе источника дефектной продукции, поставляемой предприятию несколькими сторонними поставщиками, целесообразно в качестве стратифицирующего фактора выбрать поставщиков и произвести стратификацию дефектной продукции по поставщикам.
Применение стратификации данных
При практическом использовании метода стратификации рекомендуется действовать следующим образом:
1) выберите данные, представляющие интерес для изучения;
2) выберите стратифицирующий фактор и категории (группы), на которые будут разделятся данные;
3) произведите группировку данных на основании выбранных категорий;
4) оцените результаты группировки по каждой из категорий;
5) соответствующим образом представьте полученные результаты;
6) проанализируйте необходимость дополнительного изучения данных;
7) спланируйте последующую работу для дополнительного подтверждения полученных результатов.
Рассмотрим применение метода стратификации на примере анализа качества изделий в одном из цехов предприятия. Пусть после сбора статистических данных была построена гистограмма, отображающая случайное распределение главного параметра качества продукции, представленная на рисунке Б.1а. Из этой гистограммы видно, что размах статистических данных для этого цеха превосходит поле допуска, и часть измерений выходит за верхний предел спецификации.
В процессе стратификации осуществим расслоение данных по трем сменам, работающим в цехе. Результаты стратификации представлены на рисунке Б.1б-г. Видно, что размах данных в каждой из трех смен относительно невелики, а центры гистограмм в каждой смене сильно отличаются друг от друга.
По результатам стратификации статистических данных могут быть сформулированы следующие предложения по улучшению качества продукции цеха. Например, качество продукции может быть повышено за счет проведения только организационно-технических мероприятий, направленных на регулировку оборудования в каждой смене, для смещения показателя к значению середины поля допуска.
После выполнения этих мероприятий суммарная гистограмма для цеха в целом примет вид, показанный на рисунке Б.1д. Из гистограммы видно, что при совмещении центров гистограммы для каждой смены с серединой поля допуска суммарная гистограмма для цеха в целом имеет значительно меньший размах.
Расслоение данных позволяет получить представление о скрытых причинах дефектов или выявить неочевидные пути улучшения качества продукции. При расслоении данных следует стремиться к тому, чтобы различие внутри каждой группы (страты, слоя) было как можно меньше, а различие между группами - как можно больше.

 

Приложение В
(рекомендуемое)

Примеры применения метода "Гистограммы"

Гистограмма задержек отправления поездов (сек.)
Алгоритм построения гистограммы по результатам проверки температуры плавления предохранителей

 

Приложение Г
(рекомендуемое)

Нормальное распределение

Наиболее широко используемое распределение - нормальное распределение или как его еще называют распределение Лапласа-Гаусса.
Нормальное распределение - симметричное, колоколообразное распределение. Характеризуется двумя параметрами - средним значением, обозначаемым МЮ ("мю") (так называемое математическое ожидание) и параметром, характеризующим разброс - стандартное отклонение СИГМА ("сигма").
Многие случайные величины в природе имеют нормальное распределение. Оно широко применяется в самых различных областях науки, техники, промышленности и т.п. И этому имеется теоретическое подтверждение: центральная предельная теорема утверждает, что если наблюдаемый процесс подвержен влиянию большого числа независимых случайных факторов, каждый из которых лишь ничтожно мало изменяет течение процесса, то наблюдатель, следящий за состоянием процесса в целом, видит лишь суммарное действие этих факторов, распределенное по нормальному закону.
Характерное свойство нормального распределения состоит в том, что примерно 68% всех его наблюдений лежат в диапазоне (+-) СИГМА от среднего значения, а диапазон (+-)2СИГМА содержит 95% значений.
И если допуск на характеристику находится на расстоянии (+-)3СИГМА от среднего, которое совпадает с центром поля допуска, то долю несоответствующей продукции можно оценить как 0,27% или 2700 ppm.

Оценка среднего значения, положения.
Положение, среднее значение - это значение, которое имеет исследуемая характеристика в среднем.
Положение можно оценить, например, с помощью:
- среднего арифметического;
- медианы.
Среднее арифметическое вычисляют по формуле:

                                n
СУММА x
i=1   i
Х = ----------
n

    где
n - объем выборки;
x - индивидуальные значения в выборке;
i
СУММА - знак суммирования.

Также называется "среднее" или "центр тяжести". Среднее арифметическое - наилучшая оценка положения, но часто требует вычислений с помощью калькулятора или компьютера.

Выборочная медиана
Выборочная медиана - среднее значение в упорядоченном ряду.
Для вычисления медианы для нечетного числа значений в выборке:
1) Расставьте значения по возрастанию.
2) Определите значение,  расположенное  в  центре  полученного
(n+1)
ряда - ----- -ое по порядку из n значений.
2
3) Данное значение - медиана.

Вычисление медианы для четного числа значений в выборке:
1) Расставьте значения по возрастанию,
2) Определите два центральных значения в полученном ряду:
n           n
--- -ое  и (--- +1) -ое.
2           2
3) Найдите среднее арифметическое этих значений.
4) Полученная величина - медиана.

Оценка разброса, изменчивости
На рисунке Г.3 во всех 3 ситуациях среднее значение и медиана равны 10. Но ясно, что все 3 случая различны. Они отличаются разбросом данных, расположением точек относительно среднего значения. Таким образом, для описания процесса надо рассмотреть еще характеристики, отвечающие за разброс, изменчивость.
Оценить разброс можно, например, с помощью:
- выборочного стандартного отклонения;
- Размаха

Выборочное стандартное отклонение
Выборочное стандартное отклонение (s) - оценка рассеяния, т.е. отклонения значений от среднего арифметического, измеряет "средний" разброс значений переменной относительно ее среднего арифметического. Показывает, насколько хорошо среднее значение описывает всю выборку. Выборочное стандартное отклонение вычисляется по формуле:
----------------
/   n        _ 2
/  СУММА (x - x)
\      /    i=1    i
Х = \    /   --------------
\  /         n - 1
\/

Это - сама эффективная оценка изменчивости. Проще, но менее точно, оценить изменчивость можно с помощью размаха.

Размах
Размах - оценка рассеяния, вычисляется посредством нахождения разности между максимальным и минимальным значением в выборке.