Лямбда характеристика и средняя наработка на отказ

Обновлено: 17.05.2024

Устройства хранения информации на жестких дисках традиционно устанавливались главным образом на настольных компьютерах, однако в последнее время накопители все чаще находят применение и в бытовой электронике. В настоящей статье описываются способы оценки надежности накопителей, установленных в настольных компьютерах и бытовых электронных устройствах, с использованием результатов стандартных лабораторных испытаний компании Seagate.

Определения

Испытания на надежность, проводимые Seagate

В Группе персональных устройств хранения Seagate со штаб-квартирой в г. Лонгмонт (шт. Колорадо) испытания накопителей для настольных систем на надежность обычно проводятся в термокамерах при температуре окружающей среды +42 градуса по Цельсию, что повышает интенсивность отказов. Кроме того, накопители при этом эксплуатируются с максимально возможной продолжительностью включения (под продолжительностью включения дисковода понимается количество поисков данных, их считывания и записи в течение заданного отрезка времени). Это делается для того, чтобы выявить как можно больше причин отказа еще на стадии разработки изделия. Устранив проблемы, отмеченные на этом этапе, мы можем быть уверены, что наши пользователи с ними больше не столкнутся.

Оценка параметров по Weibull

Предположим, что испытанию RDT были подвергнуты 500 накопителей, каждый из которых проработал 672 часа при температуре окружающей среды 42°С. Допустим также, что в ходе испытания было отмечено три отказа (после 12, 133 и 232 часов работы). Это означает, что из 500 проверенных накопителей успешно прошли испытание 497. Для анализа и экстраполяции полученных результатов мы применяем моделирование по Weibull, используя для этого пакет программ SuperSmith фирмы Fulton Findings 1 . В частности, с помощью метода максимального правдоподобия производится оценка таких параметров распределения Weibull, как бета (форм-фактор) и эта (масштабный коэффициент).

(То есть априори предполагается, что отказы распределены согласно Weibull. Для тех, кто знаком с математической статистикой, приведу формулу плотности вероятности для этого распределения:

Если в ходе испытания отмечено пять или менее отказов, точно определить параметр бета по полученным данным невозможно. Поскольку такие результаты испытаний встречаются довольно часто, мы анализируем их с помощью метода WeiBayes 2 , в основу которого положена оценка параметра бета по статистическим данным. В лаборатории продукции для настольных компьютеров мы сейчас принимаем бета = 0,55. Такое значение получено на основе производственных данных, представленных ниже в таблице. Она составлена на основании испытания всех накопителей для настольных систем, прошедших проверку до марта 1999 г.

Место производства накопителейБаза данныхСреднее значение бетаСтандартное отклонение бета
Лонгмонт37 RDT, 5 FRDT0,5460,176
Пераи2 RDT, 4 FRDT0,6170,068
Вузи1 RDT0,388нет данных
Обобщенные данные по настольным системам49 испытаний0,5520,167

Приведенный ниже график отображает результаты анализа Weibull и WeiBayes. Сплошная линия соответствует параметрам бета и эта по Weibull (бета = 0,443, эта = 69 331 860), рассчитанным по методу MLE (Maximum Likelihood — максимальное правдоподобие) 3 всего для 3 отказов на 500 накопителей. Как уже отмечалось, такие результаты считаются не столь точными, как полученные по методу WeiBayes для небольшой интенсивности отказов.

Следующий этап анализа состоит в пересчете параметра эта, полученного в результате тестов при 42°С, в значение, соответствующее нашей стандартной рабочей температуре (25°С). Опираясь на модель Arrhenius 5 , для учета температурных различий можно принять коэффициент учащения отказов равным 2,2208. Таким образом, значение эта для 25°С (эта25) будет равным значению этого параметра для 42°С (эта42), умноженному на 2,2208, то есть, 8 410 332 часа.

Оценка среднего времени наработки на отказ в течение первого года на основании параметров Weibull

На основании параметров бета и эта Weibull, полученных после температурной коррекции, в любой момент можно рассчитать суммарный процент отказов. Чтобы оценить процент накопителей, которые могут выйти из строя при температуре 25°С в промежутке времени от t1 до t2, достаточно произвести вычитание значений суммарного процента отказа в моменты t1 и t2, а затем воспользоваться соответствующими значениями бета и эта25.

Для оценки усредненной интенсивности отказов (параметр AFR) за первый год эксплуатации накопителя, установленного в настольном компьютере, примем, что у пользователя устройство находится во включенном состоянии 2 400 часов в год. Допустим также, что еще 24 часа оно эксплуатировалось на заводе на этапе интеграции. Поскольку все накопители, вышедшие из строя в течение этого периода, возвращаются в Seagate и к конечному пользователю не попадают, при расчете AFR и наработки на отказ за первый год они не учитываются.

С учетом приведенного выше (продолжительность включения 100%, эта25 = 8 410 332 час, бета = 0,55 и общее время работы за год 2 400 час) относительную интенсивность отказов за первый год можно рассчитать как интенсивность отказов, произошедших в период между 24 час (t1) и 2 424 час (t2). Результаты такого расчета приведены ниже в таблице, построенной на основе наработки на отказ в течение первого года и данных, полученных в ходе испытаний RDT.

Исходные данные: 2 400 час/год
Форм-фактор по Weibull (бета):0,55
Масштабный коэффициент по Weibull (эта):8 410 332
Р(отказов) от 0 до 2 400 час/год:1,123%
Р(отказов) от 0 до 24 час:0,089%
—————
AFR за первый год1,0338% (до округления)
Наработка за год:2 400 час
AFR за первый год:0,010338
—————
Наработка на отказ за первый год по Weibull:232 140 час

(Р(отказов) вычисляются на основании распределения Weibull — см. график. Далее понятно: Наработка на отказ за первый год = Наработка за год / AFR за первый год — прим. редактора).

Учет реальных условий использования

Как показывают приведенные выше расчеты, если накопитель используется при температуре 25°С и находится во включенном состоянии 2 400 часов в год, можно ожидать, что при работе у пользователя средняя наработка на отказ составит 232 140 часов. Однако такие условия соблюдаются в бытовой электронике не всегда. В некоторых бытовых приборах, скажем, накопитель может работать почти непрерывно, поэтому время его работы за год намного превысит 2 400 часов. В других же устройствах, например, игровых видеоприставках, этот показатель может оказаться значительно ниже. В последующих разделах описано, как именно можно скорректировать расчетное значение наработки на отказ для различной интенсивности использования, продолжительности включения и окружающей температуры.

Интенсивность использования

Учесть изменения средней наработки на отказ, вызванные различиями в интенсивности использования накопителя, можно с помощью приведенного графика.

Например, если известна наработка на отказ для 2 400 рабочих часов в год, а реальное рабочее время за год составляет 8 760 часов, то среднее время наработки на отказ снизится примерно вдвое. И наоборот: когда накопитель работает мало, как это бывает в некоторых игровых видеоприставках, то наработка на отказ может почти удвоиться.

Температура

Теперь давайте посмотрим, как изменяется время наработки на отказ при повышении рабочей температуры. Для построения графика температурного коэффициента времени наработки на отказ можно применить ту же модель Arrhenius, которую мы использовали для определения коэффициента учащения отказов. Представленная ниже таблица показывает, как снижается наработка на отказ за первый год (если продолжительность включения составляет 100%) при температуре окружающей среды выше 25°С.

Температура, °СКоэффициент учащения отказовТемпературный коэффициент снижения времени наработки на отказСкорректи- рованное время наработки на отказ
25 1,00001,00232 140
261,05070,95220 533
301,27630,78181 069
341,54250,65150 891
381,85520,54125 356
422,22080,45104 463
462,64650,3888 123
503,14010,3274 284
543,71030,2762 678
584,36640,2353 392
625,11860,2046 428
665,97790,1739 464
706,95620,1432 500

Как видно из таблицы, по мере роста окружающей температуры температурный коэффициент снижения времени наработки на отказ и скорректированная наработка на отказ значительно сокращаются. Так, при 42°С коэффициент учащения отказов составляет 2,2208 (как и было определено в ходе настоящего анализа ранее). А коэффициент коррекции времени наработки на отказ для этой же температуры равен 0,45, то есть среднее время наработки на отказ при температуре 42°С оказывается в два с лишним раза меньше, чем при температуре 25°С.

Продолжительность включения

Продолжительность включения большинства накопителей, установленных в персональных компьютерах, составляет от 20 до 30%, тогда как в бытовых электронных устройствах этот показатель может быть выше или ниже. Измерив объем данных, который пересылается внутри современных устройств бытовой электроники за сутки, специалисты Seagate установили, что продолжительность включения накопителей в них составляет всего 2,5%.

Как видно из графика, уменьшение продолжительности включения снижает количество только тех отказов, которые связаны со временем работы накопителя (пространство между пунктирной и сплошной линиями). Зная соотношение между количеством отказов, зависящих от продолжительности включения, и их общим числом, можно оценить влияние продолжительности включения на усредненную интенсивность отказов AFR. Так, для накопителя с четырьмя жесткими дисками общая интенсивность отказов составит 1,4%, а базовая — 0,6%. Снижение продолжительности включения уменьшит вероятность отказа на [(1,4 — 0,6)/1,4] = 57%. Таким образом, снижая время работы четырехдискового накопителя, мы можем уменьшить вероятность отказа только на 57%, остальная доля неполадок от продолжительности включения не зависит.

Изменение коэффициента наработки на отказ для накопителей с разным количеством жестких дисков представлено на следующем графике.

Комплексный учет нескольких факторов

Продолжая анализ, оценим комбинированное воздействие различных значений продолжительности включения и температурных коэффициентов сокращения наработки на отказ для нескольких накопителей. На графике внизу слева представлены коэффициенты коррекции наработки на отказ для накопителя высокой емкости с 4 жесткими дисками при разных комбинациях продолжительности включения и температуры окружающей среды. Рисунок справа отображает такие же коэффициенты для накопителя, оснащенного только одним жестким диском. Как видно из этих графиков, в зависимости от продолжительности включения и рабочей температуры накопителя, установленного в ПК, эффективная наработка на отказ за первый год может оказаться выше, равной или ниже, чем ожидаемое значение этого параметра, рассчитанное по результатам заводских испытаний. При этом на накопителе с одним жестким диском изменение продолжительности включения и окружающей температуры сказывается слабее, а коэффициенты коррекции здесь значительно меньше.

Надежность после первого года эксплуатации

Чтобы нагляднее продемонстрировать различия между моделями, мы приводим график суммарной относительной интенсивности отказов, построенный на основании каждой из них (время наработка на отказ для первого года эксплуатации принято равным 200 000 часов).

Проведенные расчеты показывают, что для оценки среднего времени наработки на отказ за три года эксплуатации дисковода нужно умножить исходный показатель за первый год (для той же продолжительности включения и окружающей температуры) на коэффициент 1,56. Аналогично можно рассчитать и среднее время наработки на отказ за пять и десять лет, умножив значение исходного параметра за первый год на 1,76 и 1,95 соответственно.

Окончательный расчет

На основе всех коэффициентов, рассчитанных выше, мы можем преобразовать наработку на отказ, указываемую фирмой Seagate (на первый год эксплуатации, при 2 400 рабочих часах в год и продолжительности включения 100%) в среднее время наработки на отказ для накопителя, установленного в устройстве конечного пользователя и работающего при конкретной окружающей температуре с определенной продолжительностью включения. После этого можно также оценить и среднее время наработки на отказ за все время службы накопителя.

Ниже приведен пример расчета среднего времени наработки на отказ в течение первого года и всего срока эксплуатации для накопителя, работающего в течение 2 400 часов в год при температуре 34°С, продолжительности включения 30% и рассчитанного на срок службы 5 лет.

Наработка на отказ за первый год:232 140 час(на основе параметров бета и эта25 по Weibull)
х 0,90(температурный коэффициент для 38°С и продолжительности включения 30%)
Наработка на отказ за первый год в устройстве пользователя: 208 926 час
Наработка на отказ в устройстве пользователя:208 926 час
х 1,76(коэффициент усреднения за пятилетний период)
Наработка на отказ за весь срок эксплуатации в устройстве пользователя:367 710 час

В качестве завершающего примера рассмотрим накопитель Seagate с одним жестким диском, для которого наработка на отказ в течение первого года составляет 444 000 час. Допустим, он установлен в бытовом электронном устройстве, используется 2 920 часов в год (8 часов в день, 7 дней в неделю) при окружающей температуре 42°С и продолжительности включения 5%.

Наработка на отказ за первый год:444 000 час(на основе параметров бета и эта25 по Weibull)
х 0,92(коррекция для 2 920 час/год)
х 0,59(температурный коэффициент для 42°С и продолжительности включения 5%)
х 1,95(коэффициент усреднения за 10-летний период)
Наработка на отказ в устройстве пользователя в течение первого года:469 956 час

Заключение

  • С помощью анализа Weibull или статистических данных испытаний RDT/FRDT оцените параметры Weibull для лабораторных условий.
  • Используя методику WeiBayes, проанализируйте данные испытаний для конкретного типа накопителя; определите значения усредненной интенсивности отказов AFR за первый год и наработку на отказ при проведении испытаний RDT.
  • Откорректируйте полученные результаты с учетом отличия лабораторных условий RDT от реальной температуры и продолжительности включения, при которых будет работать накопителей, установленный в аппаратуре конечного пользователя.
  • Исходя из осторожного предположения, что после первого года эксплуатации интенсивность отказов останется постоянной, пролонгируйте оценку надежности за первый год на трех- и десятилетний срок службы накопителя.


Выбор метода оценки времени наработки на отказ (MTBF)

MTBF - технический параметр, характеризующий надёжность/ресурс восстанавливаемого оборудования. Таким образом, это средняя продолжительность работы прибора между отказами.

В различных отраслях промышленности применяются разные методы оценки средней наработки на отказ в зависимости от особенностей жизненного цикла и технических характеристик производимого продукта. В области электроники и микроэлектроники в основном используются 3 метода:

  • Теоретический расчет времени наработки на отказ на основе конструкции системы и топологии. Метод эффективен на ранних стадиях жизненного цикла продукта для получения представления о времени наработки на отказ. Также может быть применен при небольшом объеме производства. Минус метода - отсутствие правильного / обновленного значения времени наработка на отказ для огромного количества компонентов и материалов, которые используются в производимом изделии/оборудование.
  • Метод ускоренных ресурсных испытаний. Заключается в том, чтобы поставить ограниченное количество продуктов под испытания и создать ускоренные ресурсные испытания. В рамках этого метода обычно используется повышение температуры окружающей среды и влажности и т.д. Минус метода – вероятность неизвестного поведения изделия, тестируемого под нагрузкой, и как получить значение наработки на отказ при нормальных условиях по этим данным. Имеет смысл применять данный вариант только в том случае, если в определенной степени известен механизм вычисления наработки на отказ в нормальных условиях по данным работы прибора под нагрузкой.
  • Расчет на основе сбора и анализа реальных данных. Натуральные данные собираются в рабочих условиях эксплуатации после того, как значительное количество продуктов было произведено и протестировано. Время наработки на отказ рассчитывается исходя из статистических данных дефектов оборудования и зафиксированных временных интервалов до момента дефекта.

RFSG6.jpg

Таким образом, сегодня наиболее часто применяют третий вариант. Этот метод является оптимальным выбором для определения времени наработки на отказ при наличии реальных данных, полученных в рабочих условиях эксплуатации, что позволяет проводить содержательный статистический анализ.

Специалисты компании Anapico AG выбирают этот метод оценки для получения показателя MTBF в отношении генераторов СВЧ сигналов серии RFSG2, RFSG4, RFSG6, RFSG12, RFSG20, RFSG26.

Оценка времени наработки на отказ (MTBF) для генераторов сигналов серии RFSGxx AnaPico

Компания AnaPico AG ведет подробную базу данных жизненного цикла производимого контрольно-измерительного оборудования – в том числе, фиксируются все даты отгрузки каждого подразделения, включая даты отгрузки новой продукции и возвратную отгрузку отремонтированных приборов.

Представленный ниже расчет времени наработки на отказ основан на реальных полевых данных и достоверен, но является упрощенным, так как основан только на тех данных, которые не является конфиденциальными.

В таблице 1 представлены данные, использованные при расчете MTBF и др.справочная информация о линейке генераторов RFSG2, RFSG4, RFSG6, RFSG12, RFSG20, RFSG26.

Дата начала поставки генераторов RFSGxx - июнь 2011. Количество продуктов в серии – 3 (RFSG12, RFSG20, RFSG26). Конструктивные отличия минимальные. Все три генератора доступны в различных форм-факторах, настольном исполнении и для монтажа в стойку 19 дюймов 1U. В упрощенном отчете для оценки MTBF не учитывается разница в дизайне и форм-факторы.

С 1 января 2012 года по 31 декабря 2015 года (4 года). Данные за 1-е полугодие не учитываются (низкий объем поставок в период наращивания сбыта), дабы не искажать статистический расчет время наработки на отказ.

Оборудование для ремонта

Скорость использования продукта (% времени в эксплуатации)

0,1. Таким образом, среднее время работы каждой единицы за рабочий день составляет около 2,4*365/220 = 4 часа.

Вычисляем MTBF для RFSGxx AnaPico

MTBF (время наработки на отказ) = Совокупные часы работы от общего количества поставленных единиц в выборочном периоде / Сбои в периоде выборки

Используя данные таблицы 1 и формулу нахождения времени наработки на отказ, вычисляем:

совокупные часы работы общего количества поставленных единиц в достаточном периоде: 375*0,5*0.1*4*365*24=657 000 часов

MTBF (время наработки на отказ): 657000 / 7 = 93 857 часов

В связи с тем, что данный расчет времени наработки на отказ является упрощенным, во внимание не были приняты некоторые аспекты, которые необходимо учитывать при вычислении более точного показателя MTBF. В конкретном примере вычисления MTBF эти упрощения допустимы, в виду того, что:

Фактически, некоторые дефектные единицы не возвращаются пользователями для ремонта. С другой стороны, согласно данным сервисной службы, почти половина дефектов была вызвана ненадлежащим использованием, и, следовательно, не связана с надежностью оборудования, предусмотренной производителем.

Время на логистику оборудования (в т.ч. международную) также не принимается во внимание, т.к. оно сравнительно короткое по отношению к периоду сбора учетных данных в 4 года.

Выводы

Время наработки на отказ (MTBF) генераторов сигналов ANAPICO RFSG2, RFSG4, RFSG6, RFSG12, RFSG20, RFSG26 составляет порядка 100 тыс. часов. Показатель получен на основе анализа реальных данных в рабочих условиях эксплуатации в течение достаточно длительного временного периода и подтверждает существенный ресурс и надежность указанного измерительного оборудования.

В английской литературе MTBF (Mean time between failures — среднее время между отказами) — среднее время между возникновениями отказов. Термин обычно касается работы оборудования. Единица размерности — час.

Системы, связанные с обеспечением безопасности, можно условно подразделить на две категории:
работающие в режиме низкой частоты запросов
и в режиме высокой частоты запросов (непрерывно).

IEC 61508 количественно определяет эту классификацию, устанавливая, что частота запросов на работу системы обеспечения безопасности не превышает одного раза в год в режиме низкой частоты запросов, и более раза в год в режиме высокой частоты запросов (непрерывной работы).
Значение SIL для систем обеспечения безопасности с низкой частотой запросов непосредственно зависит от диапазонов порядков средней вероятности того, что она не сможет удовлетворительно выполнить свои функции по обеспечению безопасности по запросу, или, проще говоря, от вероятности отказа при запросе (PFD). Значение SIL для систем обеспечения безопасности, работающих в режиме высокой частоты запросов (непрерывно) непосредственно зависит от вероятности возникновения опасного отказа в час (PFH).

PFD (Probability of Failure on Demand, Вероятность отказа при запросе) — средняя вероятность того, что система не выполнит свою функцию по запросу.
PFH (Probability of Failure per Hour, Вероятность возникновения отказа за час) — вероятность возникновения в системе опасного отказа в течение часа.
MTTR (Mean Time to Restoration, Среднее время до восстановления работоспособности) — среднее время, необходимое для восстановления нормальной работы после возникновения отказа.
DC (Diagnostic Coverage, Диагностическое покрытие) — отношение количества обнаруженных отказов к общему числу отказов. В свою очередь, λ = частота отказов = 1/MTBF (для экспоненциального распределения отказов).

Наработка на отказ — технический параметр, характеризующий надёжность восстанавливаемого прибора, устройства или технической системы.

Средняя продолжительность работы устройства между ремонтами, то есть показывает, какая наработка в среднем приходится на один отказ. Выражается обычно в часах.

Для программных продуктов обычно подразумевается срок до полного перезапуска программы или полной перезагрузки операционной системы.

Наработка до отказа — эквивалентный параметр для неремонтопригодного устройства. Поскольку устройство неремонтируемое, то это просто среднее время, которое проработает устройство до того момента, как сломается.

Наработка — продолжительность или объем работы объекта, измеряемая в часах, мото-часах, гектарах, километрах пробега, циклов включений и др.

Измеряется статистически, путём испытания множества приборов, или вычисляется методами теории надёжности.

где ti — наработка i-го объекта между отказами; m — число отказов.

Содержание

Определение по ГОСТ

ГОСТ 27.002-89 определяет данные параметры следующим образом:

  • Наработка на отказ (или средняя наработка на отказ) англ.Mean operating time between failures — отношение суммарной наработки восстанавливаемого объекта к математическому ожиданию числа его отказов в течение этой наработки.
  • Наработка до отказаангл.Operating time to failure — Наработка объекта от начала эксплуатации до возникновения первого отказа.

Зарубежная терминология

В английской литературе MTBF (англ. Mean time between failures ), среднее время между отказами, наработка на отказ) — среднее время между возникновениями отказов. [1] ; термин обычно касается работы оборудования. Единица размерности - час.

Системы, связанные с обеспечением безопасности, можно условно подразделить на две категории:

  • работающие в режиме низкой частоты запросов
  • и в режиме высокой частоты запросов (непрерывно).

IEC 61508 (англ.) русск. количественно определяет эту классификацию, устанавливая, что частота запросов на работу системы обеспечения безопасности не превышает одного раза в год в режиме низкой частоты запросов, и более раза в год в режиме высокой частоты запросов (непрерывной работы).

Значение SIL (англ.) русск. для систем обеспечения безопасности с низкой частотой запросов непосредственно зависит от диапазонов порядков средней вероятности того, что она не сможет удовлетворительно выполнить свои функции по обеспечению безопасности по запросу, или, проще говоря, от вероятности отказа при запросе (PFD). Значение SIL для систем обеспечения безопасности, работающих в режиме высокой частоты запросов (непрерывно) непосредственно зависит от вероятности возникновения опасного отказа в час (PFH).

PFD (Probability of Failure on Demand, Вероятность отказа при запросе) — средняя вероятность того, что система не выполнит свою функцию по запросу. PFH (Probability of Failure per Hour, Вероятность возникновения отказа за час) — вероятность возникновения в системе опасного отказа в течение часа. MTTR (Mean Time to Restoration, Среднее время до восстановления работоспособности) — среднее время, необходимое для восстановления нормальной работы после возникновения отказа. DC (Diagnostic Coverage, Диагностическое покрытие) — отношение количества обнаруженных отказов к общему числу отказов.

В свою очередь, λ = частота отказов = 1/ MTBF

Среднее время безотказной работы системы

T_0

Среднее время безотказной работы (средняя наработка на отказ) — для невосстанавливаемых (неремонтируемых) систем - это математическое ожидание времени работы системы до отказа:

 T_0 = M = \int\limits_0^\mathcal </p>
<p> t \cdot f(t) dt = - \int\limits_0^\mathcal t dP(t)

Пределы несобственного интеграла изменяются от 0 до ∞, так как время не может быть отрицательным; - есть плотность вероятности возникновения отказов системы или её невосстанавливаемого элемента. - есть вероятность безотказной работы в интервале времени . В начальный момент вероятность Р(T) равна единице. В конце времени работы системы вероятность равна нулю. Вероятность связана с плотностью вероятности возникновения отказов системы или её невосстанавливаемого элемента следующим образом:

 f(t) = - \frac<d P(t)></p>
<p>
.

T_0

Проинтегрировав выражение для по частям, получим:

 T_0 = \int\limits_0^\mathcal <1></p>
<p> P(t) dt

T_0

Графически полученное выражение для представлено на рисунке как площадь под графиком вероятности безотказной работы Р(T) от времени T. В начальный момент вероятность Р(T) равна единице. В конце времени работы системы вероятность P(T) равна нулю.

T \ge 0

Здесь — случайное время работы системы до отказа или наработка на отказ для невосстанавливаемого элемента или системы.

Читайте также: