Перейти к содержанию

Reliability (Надежность)

Вероятность работы ПО без сбоев в течение определенного периода времени называется надежностью. Для измерения надежности ПО используют такие показатели, как процент успешно завершенных операций и среднее время наработки на отказ (Mean Time Between Failures, или MTBF) и максимальная приемлемая вероятность отказа за определенный период времени.

Примеры

REL-1. Не более 5 из 1000 начатых экспериментов могут быть потеряны из-за сбоев ПО.

REL-2. Среднее время между отказами устройства чтения карт должно не превышать 90 дней.

Вопросы

  • Как вы будете определять, достаточно ли надежна система?

  • Каковы должны быть последствия сбоя при выполнении определенных операций в системе?

  • Что вы будете считать критическим отказом, а что — всего лишь досадной неприятностью?

  • При каких условиях сбой может иметь серьезные последствия для ваших бизнес-операций?

  • Никому не нравится сталкиваться со сбоем системы, но есть ли какие-то части системы, которые совершенно точно должны быть чрезвычайно на- дежными?

  • Если система станет неработоспособной, сколько времени вы сможете обой- тись без нее, пока это заметно не скажется на ваших бизнес-операциях?